Top-KI-Modelle hinken bei routinemäßigen Unternehmensaufgaben hinterher, sagt Databricks: Kleinere spezialisierte Modelle sind überlegen

Gate News-Mitteilung, 20. April — Top-KI-Modelle sind hervorragend darin, komplexe Probleme zu lösen, wie Olympiademathematik, aber sie haben Schwierigkeiten mit routinemäßiger Arbeit im Unternehmen, so David Meyer von Databricks. Einige Modelle korrigieren möglicherweise eine falsche Rechnungsnummer statt sie als Fehler zu markieren, während Codier-Tools wie Claude bei Aufgaben im Bereich Data Engineering ebenfalls unterdurchschnittlich abschneiden können.

Die Lücke rührt von grundlegenden Unterschieden zwischen Unternehmensdaten und dem öffentlichen Web-Text her, der zur Schulung großer Modelle verwendet wird. Unternehmensdaten weisen oft vage Spaltenbezeichnungen auf, zahlreiche leere Felder und Codes, die als Klartext gespeichert sind. In einer akademischen Studie sank der F1-Score eines KI-Modells, der Precision und Recall ausbalanciert, von 0,94 auf öffentlichen Daten auf 0,07 bei Unternehmensdaten für eine Aufgabe im Data Engineering. Außerdem neigen große Modelle dazu, auf vertraute Muster aus dem Training zurückzugreifen; einige defaulteten zu Structured Query Language (SQL), selbst nachdem sie Anweisungen und Dokumentation für eine firmeneigene Abfragesprache erhalten hatten.

Kleinere Open-Source-Modelle, die mit Reinforcement Learning feinabgestimmt wurden, können bestimmte Jobs effizienter bewältigen und verursachen dabei deutlich geringere Schulungskosten als große, allgemeine Modelle. Databricks baut kleinere KI-Agenten für spezifische Workflows, wie KARL, das Reinforcement Learning für mehrstufiges Reasoning mit Unternehmensdokumenten nutzt. Die Branche verlagert sich von der Abhängigkeit von riesigen Modellen hin zu hybriden Architekturen: kleine, effiziente Modelle übernehmen das routinemäßige Volumen und eskalieren nur unklare oder komplexe Fälle an größere, kostspieligere Systeme.

Databricks hat kürzlich Quotient AI übernommen, um großen Unternehmen dabei zu helfen, KI-Agenten zuverlässiger einzusetzen. Der Wettbewerb im KI-Geschäft konzentriert sich inzwischen darauf, den vollständigen KI-Lifecycle abzuwickeln, einschließlich Feedback-Systemen zur Fehlerverfolgung und einer kontinuierlichen Verbesserung der Modelle über Zeit hinweg. Dadurch werden Evaluierungs- und Tuning-Tools nach dem Deployment immer wertvoller.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

KI-Agenten übernehmen die umfassende Unternehmensführung! Ein neues Geschäftsmodell: KI-gesteuerte Verkaufsautomaten in San Francisco zeigen neue Chancen auf

Dieser Bericht besagt, dass Valeries automatisierter Verkaufsautomat von OpenClaw gesteuert wird, sodass KI-Agenten das Tagesgeschäft in der Praxis führen, darunter Preisgestaltung, Bestände, Community und sogar die Verwaltung von Bankkonten. Tests zeigen, dass KI Unternehmensleiter-Entscheidungen simulieren kann, allerdings treten Preis-Irrtümer auf, wie etwa das Hochsetzen des Preises für einen Proteinriegel auf 15 US-Dollar. Juristische Hürden wie KYC, Bankkonto-Eröffnungen und Lebensmittelzulassungen sind noch nicht überwunden; obwohl es Mechanismen wie Trusts gibt, mit denen KI-Agenten Unternehmen im Wert von Kapitalanteilen halten können, bleiben in der Praxis noch viele Herausforderungen.

ChainNewsAbmedia1Std her

KI-Agent Manfred gründet das Unternehmen, erhält vor dem Start des Krypto-Handels im Mai ein Wallet

Der KI-Agent Manfred hat ein eigenes Unternehmen gegründet und eine Krypto-Wallet sowie Zugangsdaten erhalten, um Mitarbeiter einzustellen, Zahlungen vorzunehmen und Geschäfte abzuwickeln. Der Agent ist nicht geplant, mit dem Handel von Krypto zu beginnen, bis zum Ende von

GateNews3Std her

MoonPay bringt die MoonAgents-Karte auf den Markt, eine Stablecoin-Debitkarte für KI-Agenten auf Mastercard

MoonPay kündigte am Freitag die Einführung der MoonAgents Card an, einer virtuellen Mastercard-Debitkarte, die Stablecoins zum Zeitpunkt der Zahlung in Fiat umwandelt – sowohl für KI-Agenten als auch für Nutzer. Die Karte, die über Monavate ausgegeben wird (eine regulierte globale Zahlungsplattform und Mastercard-Hauptmitglied), verknüpft

GateNews3Std her

KI-Agent Manfred gründet ein Unternehmen, erhält einen Krypto-Wallet vor dem Start des Mai-Tradings

Der KI-Agent Manfred hat ein eigenes Unternehmen gegründet und eine Krypto-Wallet sowie Geschäftszugangsdaten erhalten, obwohl er mit dem Handel von Kryptowährungen erst Ende Mai beginnen wird. Der Agent ist nun in der Lage, Personal einzustellen, Zahlungen zu leisten und Geschäfte abzuwickeln.

GateNews9Std her

MoonPay bringt am Freitag die MoonAgents Card auf den Markt – eine virtuelle Mastercard für KI-Agenten und Nutzer

Laut The Block hat MoonPay am Freitag die MoonAgents Card gelauncht, eine virtuelle Mastercard-Debitkarte für KI-Agenten und Nutzer. Die Karte wandelt Stablecoins an der Verkaufsstelle in Fiat um und kann bei jedem Online-Händler weltweit verwendet werden, der Mastercard akzeptiert. Ausgestellt über Monavate, ein regulierter Zahlungsanbieter

GateNews13Std her

MoonPay bringt am Freitag die MoonAgents Card im Mastercard-Netzwerk auf den Markt

Laut The Block hat MoonPay am Freitag die MoonAgents Card gelauncht – eine virtuelle Mastercard-Debitkarte, die KI-Agents und Nutzer dazu befähigt, Stablecoins direkt von Onchain-Wallets aus auszugeben. Die Karte wird über Monavate ausgegeben, eine regulierte globale Zahlungsplattform und Principal Member von Mastercard, in

GateNews15Std her
Kommentieren
0/400
Keine Kommentare