Gate-News-Meldung, 27. April — Logan Kilpatrick, Senior-Produktmanager bei Google DeepMind und Produktleiter für Google AI Studio, sagte auf X, dass jede Firma, die KI-basierte Produkte entwickelt, eigene benutzerdefinierte Benchmarks festlegen sollte, um die Leistung von KI-Modellen zu messen. Er beschrieb dies als eine Methode, um Modellverbesserungen „unverhältnismäßig vorteilhaft für Ihr Unternehmen“ zu machen, und forderte Gründer und Führungskräfte auf, „morgen anzufangen.“
Die meisten Unternehmen verlassen sich derzeit auf öffentliche Ranglisten, um KI-Modelle auszuwählen, aber diese messen allgemeine Fähigkeiten, die oft nicht zu konkreten Geschäftsszenarien passen. Kilpatrick nannte das Beispiel eines Vertragsprüfungsunternehmens, das vor allem auf die Genauigkeit der Extraktion von Klauseln bedacht ist – eine Fähigkeit, die in öffentlichen Benchmarks nicht vorkommt, wodurch es unmöglich ist, die Modellleistung bei dieser Aufgabe zu bewerten. Benutzerdefinierte Benchmarks bieten zwei zentrale Vorteile: Erstens ermöglichen sie es Unternehmen, jede Modellaktualisierung anhand ihrer eigenen Geschäftstasks zu bewerten und das Modell auszuwählen, das in ihrem tatsächlichen Anwendungsfall am besten abschneidet, statt das insgesamt höchstrangige Modell zu nehmen; zweitens erlauben sie es Unternehmen, diese Testsätze mit den Modellanbietern zu teilen und so eine kontinuierliche Optimierung in Bereichen zu erreichen, die für ihr Geschäft relevant sind.
Kilpatrick bemerkte, dass Unternehmen wie Zapier und Sierra diesen Ansatz bereits umsetzen, und sagte: „Hier lässt sich sehr viel Alpha erzeugen.“
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to
Disclaimer.
Verwandte Artikel
Hongkong-Labor bringt HKGAI-V3-KI-Modell auf chinesischen Chips im ersten Halbjahr 2026 auf den Markt
Laut dem South China Morning Post plant das Hong Kong Generative AI Research and Development Centre, in der ersten Hälfte des Jahres 2026 sein HKGAI-V3-Modell auf den Markt zu bringen. Das System soll für den Betrieb auf in China hergestellten Chips optimiert sein, darunter auch auf HUAWEIs Ascend 910C. Das Modell basiert auf der DeepSeek-V4-Architektur mit
GateNewsGerade eben
AlphaDrive startet $100M einen israelischen Fonds für KI- und Cybersicherheit
Yaron Elad und Elik Etzion, ehemalige Führungskräfte bei Israels Elron Ventures, haben AlphaDrive ins Leben gerufen, einen 100-Millionen-US-Dollar-Fonds mit Fokus auf Cybersicherheit und künstliche Intelligenz, wie Calcalist berichtet.
Fondsstruktur und Investment-Ansatz
AlphaDrive richtet sich an Start-ups, die von Israelis gegründet wurden
CryptoFrontier19M her
OpenAI-Vertriebschef James Dyett verlässt das Unternehmen für Thrive Capital
Laut CNBC kündigte der Vertriebschef von OpenAI, James Dyett, am Montag seinen Abschied an und wird zum Venture-Capital-Unternehmen Thrive Capital wechseln. Dyett war seit 2023 bei OpenAI und leitete sowohl den Vertrieb für Unternehmen als auch den Vertrieb für APIs
GateNews24M her
Sierra schließt die $950M -Series-E-Finanzierung im Wert von 15,8 Milliarden US-Dollar Bewertung ab, angeführt von Tiger Global und GV
Laut ChainCatcher hat Sierra, ein auf Unternehmens-KI spezialisiertes Startup, das vom Vorsitzenden des OpenAI-Aufsichtsrats Bret Taylor und dem ehemaligen Google-Manager Clay Bavor gegründet wurde, eine Finanzierungsrunde der Serie E über 950 Millionen US-Dollar mit einer Post-Money-Bewertung von 15,8 Milliarden US-Dollar abgeschlossen. Die Runde wurde von Tiger Global und dem Venture-Arm von Alphabet, G, angeführt
GateNews34M her
OpenAI erhöht $4 Milliarden US-Dollar für ein Venture zur Bereitstellung von Enterprise-KI
Laut Bloomberg hat OpenAI für The Deployment Company, ein neues Unternehmen, das es kontrollieren wird, um Unternehmen dabei zu helfen, seine KI-Software einzuführen, über $4 Milliarden US-Dollar aufgebracht. Das Vorhaben ist vor dem neuen Kapital mit 10 Milliarden US-Dollar bewertet und wird von 19 Investoren getragen, angeführt von TPG und Brookfield Asset Management, zusammen
GateNews40M her
OpenAI-Mitgründer Brokeman bestätigt $30B -Holdings in einer Aussage vor Gericht am Montag
Am Montag bestätigte Greg Brokman, Mitgründer und Präsident von OpenAI, während einer Gerichtsverhandlung in einem Rechtsstreit zwischen OpenAI und Elon Musk, dass sein Anteil an dem Unternehmen im Wert von nahezu 30 Milliarden US-Dollar liegt. Auf die Frage, ob der Wert „näher an 30 Milliarden US-Dollar“ liege, antwortete Brokman mit Ja.
GateNews40M her