Hugging Face macht ml-intern Open Source: ein KI-Agent für autonome ML-Forschung

Gate-News-Meldung, 22. April — Hugging Face hat ml-intern open-sourct, einen ML-Forschungsagenten, der in der Lage ist, den vollständigen Workflow autonom abzuschließen: Papers lesen, Datensets organisieren, GPU-Training starten, Ergebnisse auswerten und Verbesserungen iterieren. Das Projekt basiert auf Hugging Faces smolagents-Framework und bietet sowohl eine CLI- als auch webbasierte Oberflächen; der Code ist auf GitHub verfügbar.

Die ml-intern-Toolchain ist auf das Hugging-Face-Ökosystem ausgerichtet. Sie ruft Papers aus arXiv und HF Papers ab, verfolgt dabei Zitierketten für ein tieferes Lesen; durchsucht Datensets auf HF Hub, validiert die Qualität und formatiert die Daten für das Training um; und wenn lokale GPU-Ressourcen nicht verfügbar sind, ruft sie HF Jobs auf, um cloudbasierte Training-Aufgaben zu starten. Nach Abschluss des Trainings liest der Agent automatisch die Auswertungsoutputs, diagnostiziert Ursachen für Fehlschläge und führt Experimente erneut aus. Standardmäßig nutzt er Claude Sonnet 4.5, um die Entscheidungs-Loop anzutreiben, mit maximal 300 Iterationen pro Lauf und automatischer Kontextkomprimierung, wenn 170k Tokens überschritten werden.

Hugging Face hat drei Use Cases demonstriert. Bei einer Aufgabe zur wissenschaftlichen Begründung identifizierte der Agent OpenScience- und NemoTron-CrossThink-Datensets über Zitierketten, filterte sieben Varianten aus ARC, SciQ und MMLU nach Schwierigkeitsgrad und führte 12 Runden überwachten Feintunings auf Qwen3-1.7B durch, wodurch die GPQA-Werte von 10% auf 32% in unter 10 Stunden verbessert wurden. Für eine medizinische Anwendung stellte der Agent fest, dass die vorhandenen Datensets nicht ausreichten, schrieb Skripte zur Generierung von 1.100 synthetischen Datensamples und skalierte sie 50-fach für das Training, wodurch die Codex-Leistung auf HealthBench um 60% übertroffen wurde. In einem kompetitiven Mathe-Szenario schrieb der Agent ein GRPO-Trainingsskript und startete das Training auf A100-GPUs über HF Spaces; anschließend führte er Ablationsstudien durch, nachdem er einen Zusammenbruch der Belohnung beobachtet hatte.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Forscher setzen DPN-LE-Technologie ein, um KI-Persönlichkeitsmerkmale zu bearbeiten, wobei nur 0,5 % der Neuronen verändert werden

Laut BlockBeats hat der KI-Forscher Brian Roemmele am 3. Mai offengelegt, dass seine Zero-Human Company die DPN-LE-(Dual Personality Neuron Localization and Editing)-Technologie eingesetzt hat, um präzise anzupassen

GateNews4Std her

KI-Agent Manfred gründet ein Unternehmen und richtet ein Krypto-Wallet ein, um bis Ende Mai zu handeln

Der KI-Agent Manfred hat ein eigenes Unternehmen gegründet und eine Krypto-Wallet sowie Geschäftszertifikate erhalten, einschließlich der Fähigkeit, Mitarbeitende einzustellen und Zahlungen vorzunehmen. Der Agent soll bis zum Ende von mit dem Kryptowährungshandel beginnen.

GateNews4Std her

Tether-CEO schlägt die Integration von WDK und QVAC für die Unterstützung von Agent Cards vor

Laut Foresight News erklärte Tethers CEO Paolo Ardoino auf X, dass der Stablecoin-Emittent möglicherweise die Integration zwischen WDK und QVAC vorantreiben muss, um die Agent-Cards-Funktionalität zu unterstützen.

GateNews8Std her

Particle Network veröffentlicht Roadmap für universelle Konten, startet Universal Deposit SDK und AI-Agent-Konten

Laut ChainCatcher hat Particle Network heute die Roadmap für die nächste Phase für Universal Accounts veröffentlicht und zwei neue Produkte für die kommenden Monate angekündigt: Universal Deposit SDK, mit dem Entwickler Multi-Chain-Einzahlungen mit etwa 10 Zeilen Code hinzufügen können, und Universal Agent Accounts,

GateNews8Std her

OpenAI ermöglicht ChatGPT-Abonnements, auf der Agent-Plattform OpenClaw zu funktionieren

Laut dem OpenAI-CEO Sam Altman können sich ChatGPT-Nutzer seit dem 2. Mai jetzt mit ihren ChatGPT-Konten in die Agenten-Plattform OpenClaw einloggen und ihre bestehenden ChatGPT-Abonnements direkt auf der Plattform nutzen.

GateNews10Std her

Der KI-Agent Manfred gründet das Unternehmen und bereitet sich bis Ende Mai auf den Krypto-Handel vor

Der KI-Agent Manfred hat ein eigenes Unternehmen gegründet und eine Krypto-Wallet sowie Zugangsdaten erhalten, um Personal einzustellen, Zahlungen zu tätigen und Geschäfte abzuwickeln. Der Agent plant, bis zum Jahresende mit dem Handel von Kryptowährungen zu beginnen.

GateNews11Std her
Kommentieren
0/400
Keine Kommentare