Google DeepMind-Manager: Jede KI-Produktfirma sollte benutzerdefinierte Benchmarks entwickeln

Gate-News-Meldung, 27. April — Logan Kilpatrick, Senior-Produktmanager bei Google DeepMind und Produktleiter für Google AI Studio, sagte auf X, dass jede Firma, die KI-basierte Produkte entwickelt, eigene benutzerdefinierte Benchmarks festlegen sollte, um die Leistung von KI-Modellen zu messen. Er beschrieb dies als eine Methode, um Modellverbesserungen „unverhältnismäßig vorteilhaft für Ihr Unternehmen“ zu machen, und forderte Gründer und Führungskräfte auf, „morgen anzufangen.“

Die meisten Unternehmen verlassen sich derzeit auf öffentliche Ranglisten, um KI-Modelle auszuwählen, aber diese messen allgemeine Fähigkeiten, die oft nicht zu konkreten Geschäftsszenarien passen. Kilpatrick nannte das Beispiel eines Vertragsprüfungsunternehmens, das vor allem auf die Genauigkeit der Extraktion von Klauseln bedacht ist – eine Fähigkeit, die in öffentlichen Benchmarks nicht vorkommt, wodurch es unmöglich ist, die Modellleistung bei dieser Aufgabe zu bewerten. Benutzerdefinierte Benchmarks bieten zwei zentrale Vorteile: Erstens ermöglichen sie es Unternehmen, jede Modellaktualisierung anhand ihrer eigenen Geschäftstasks zu bewerten und das Modell auszuwählen, das in ihrem tatsächlichen Anwendungsfall am besten abschneidet, statt das insgesamt höchstrangige Modell zu nehmen; zweitens erlauben sie es Unternehmen, diese Testsätze mit den Modellanbietern zu teilen und so eine kontinuierliche Optimierung in Bereichen zu erreichen, die für ihr Geschäft relevant sind.

Kilpatrick bemerkte, dass Unternehmen wie Zapier und Sierra diesen Ansatz bereits umsetzen, und sagte: „Hier lässt sich sehr viel Alpha erzeugen.“

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Hongkong-Labor bringt HKGAI-V3-KI-Modell auf chinesischen Chips im ersten Halbjahr 2026 auf den Markt

Laut dem South China Morning Post plant das Hong Kong Generative AI Research and Development Centre, in der ersten Hälfte des Jahres 2026 sein HKGAI-V3-Modell auf den Markt zu bringen. Das System soll für den Betrieb auf in China hergestellten Chips optimiert sein, darunter auch auf HUAWEIs Ascend 910C. Das Modell basiert auf der DeepSeek-V4-Architektur mit

GateNewsGerade eben

AlphaDrive startet $100M einen israelischen Fonds für KI- und Cybersicherheit

Yaron Elad und Elik Etzion, ehemalige Führungskräfte bei Israels Elron Ventures, haben AlphaDrive ins Leben gerufen, einen 100-Millionen-US-Dollar-Fonds mit Fokus auf Cybersicherheit und künstliche Intelligenz, wie Calcalist berichtet. Fondsstruktur und Investment-Ansatz AlphaDrive richtet sich an Start-ups, die von Israelis gegründet wurden

CryptoFrontier19M her

OpenAI-Vertriebschef James Dyett verlässt das Unternehmen für Thrive Capital

Laut CNBC kündigte der Vertriebschef von OpenAI, James Dyett, am Montag seinen Abschied an und wird zum Venture-Capital-Unternehmen Thrive Capital wechseln. Dyett war seit 2023 bei OpenAI und leitete sowohl den Vertrieb für Unternehmen als auch den Vertrieb für APIs

GateNews24M her

Sierra schließt die $950M -Series-E-Finanzierung im Wert von 15,8 Milliarden US-Dollar Bewertung ab, angeführt von Tiger Global und GV

Laut ChainCatcher hat Sierra, ein auf Unternehmens-KI spezialisiertes Startup, das vom Vorsitzenden des OpenAI-Aufsichtsrats Bret Taylor und dem ehemaligen Google-Manager Clay Bavor gegründet wurde, eine Finanzierungsrunde der Serie E über 950 Millionen US-Dollar mit einer Post-Money-Bewertung von 15,8 Milliarden US-Dollar abgeschlossen. Die Runde wurde von Tiger Global und dem Venture-Arm von Alphabet, G, angeführt

GateNews34M her

OpenAI erhöht $4 Milliarden US-Dollar für ein Venture zur Bereitstellung von Enterprise-KI

Laut Bloomberg hat OpenAI für The Deployment Company, ein neues Unternehmen, das es kontrollieren wird, um Unternehmen dabei zu helfen, seine KI-Software einzuführen, über $4 Milliarden US-Dollar aufgebracht. Das Vorhaben ist vor dem neuen Kapital mit 10 Milliarden US-Dollar bewertet und wird von 19 Investoren getragen, angeführt von TPG und Brookfield Asset Management, zusammen

GateNews40M her

OpenAI-Mitgründer Brokeman bestätigt $30B -Holdings in einer Aussage vor Gericht am Montag

Am Montag bestätigte Greg Brokman, Mitgründer und Präsident von OpenAI, während einer Gerichtsverhandlung in einem Rechtsstreit zwischen OpenAI und Elon Musk, dass sein Anteil an dem Unternehmen im Wert von nahezu 30 Milliarden US-Dollar liegt. Auf die Frage, ob der Wert „näher an 30 Milliarden US-Dollar“ liege, antwortete Brokman mit Ja.

GateNews40M her
Kommentieren
0/400
Keine Kommentare