Google Research veröffentlicht ReasoningBank: KI-Agenten lernen Verarbeitungsstrategien aus Erfolg und Misserfolg

Gate News-Nachricht, 22. April — Google Research hat ReasoningBank veröffentlicht, ein Framework für Agentenspeicher, das modellbasierte Agenten mit großen Sprachmodellen ermöglicht, nach der Bereitstellung kontinuierlich dazuzulernen. Das Framework extrahiert universelle Verarbeitungsstrategien aus sowohl erfolgreichen als auch fehlgeschlagenen Aufgaben-Erfahrungen und speichert sie in einem Speicher-Bank-System zur späteren Suche und Ausführung bei ähnlichen zukünftigen Aufgaben. Das zugehörige Paper wurde auf ICLR veröffentlicht, und der Code wurde auf GitHub open-sourced.

ReasoningBank verbessert zwei bestehende Ansätze: Synapse, das vollständige Aktionsverläufe aufzeichnet, jedoch nur eingeschränkt übertragbar ist, da es eine sehr feingranulare Granularität hat, und Agent Workflow Memory, das nur aus erfolgreichen Fällen lernt. ReasoningBank bringt zwei zentrale Änderungen: das Speichern von “reasoning patterns” statt von “action sequences”, wobei jede Memory strukturierte Felder für Titel, Beschreibung und Inhalt enthält; und das Einbeziehen von Failure-Trajectories in das Lernen. Das Framework verwendet ein Modell, um Ausführungsverläufe selbst zu bewerten, und verwandelt damit Misserfolgserfahrungen in Anti-Fallstrick-Regeln. Beispielsweise entwickelt sich die Regel “klicke auf die Schaltfläche „Load More“, wenn sie sichtbar ist” zu “prüfe zuerst die ID der aktuellen Seite, vermeide dann unendliche Scroll-Schleifen, und klicke anschließend auf „load more“.”

Das Paper führt außerdem Memory-aware Test-time Scaling (MaTTS) ein, das während der Inferenz zusätzliche Rechenleistung bereitstellt, um mehrere Verläufe zu erkunden und die Erkenntnisse in der Speicher-Bank zu speichern. Parallel Expansion führt mehrere unterschiedliche Verläufe für dieselbe Aufgabe aus und verbessert robustere Strategien durch Selbstvergleich; sequentielle Expansion verfeinert iterativ genau einen Verlauf und speichert dabei die Zwischenerkenntnisse im Speicher.

Bei WebArena-Browsing-Aufgaben und SWE-Bench-Verified-Coding-Aufgaben, bei denen Gemini 2.5 Flash als ReAct-Agent eingesetzt wird, erreichte ReasoningBank eine um 8,3% höhere Erfolgsquote bei WebArena und um 4,6% höhere bei SWE-Bench-Verified im Vergleich zu einer Baseline ohne Memory. Dabei reduzierte es die durchschnittliche Anzahl der Schritte pro Aufgabe um etwa 3. Das Hinzufügen von MaTTS mit Parallel Expansion (k=5) verbesserte die WebArena-Erfolgsquote zusätzlich um 3 Prozentpunkte und reduzierte die Schritte um weitere 0,4.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Steht der Taiwan-Index bei 40.000 Punkten fest, während US-Aktien neue Allzeithochs erreichen, aber die KI-Branche erst in eine frühe Phase eingetreten ist?

Goldman Sachs weist darauf hin, dass die KI-Nachfrage durch konsumorientierte Agent-Workloads den Token-Verbrauch deutlich erhöhen wird; bis 2030 könnte das Wachstum um mehr als das Zwölffache steigen, wobei die monatliche Token-Computing-Leistung bis zu 60 Billionen erreichen kann. Der Unterschied zwischen nicht-agentenbasierten Workloads und Consumer-Agents besteht darin, dass Letztere Aufgaben über lange Zeit hinweg automatisch ausführen; falls sich das bewahrheitet, wird die KI in agentische Arbeitsabläufe übergehen. Larry Fink erklärte, dass die Versorgung mit Rechenleistung stark knapp sei; künftig könnten sich Rechenleistungs-Futures herausbilden. Beide zusammen stützen die Bull-These für den Aufbau der KI-Infrastruktur; der Artikel geht davon aus, dass sich die KI noch in einem frühen Stadium befindet.

ChainNewsAbmedia50M her

WLFI-ein Ökosystem-AI-Projekt WorldClaw bringt ein Agenten-Betriebssystem heraus und kann es für 10.000 US-Dollar verkaufen, ohne die Marke offenzulegen?

Das Krypto-Projekt World Liberty Financial (WLFI) aus dem Umfeld von Trump holt mit einer neuen Maßnahme aus: In Zusammenarbeit mit WorldClaw wird das KI-Modell-Universal-Portal WorldRouter vorgestellt. Im Fokus steht eine Agenten-Plattform, die die Integration von 300 KI-Modellen bündelt. Das teuerste Abo kostet fast 10.000 US-Dollar, allerdings wird als Zugabe eine Hardware-Einheit geliefert, deren Marke und Betriebssystem nicht offengelegt wurden—was bei Beobachtern Zweifel auslöst. @WorldClawAI erweitert den Zugang zu KI, und $WLFI spielt in dem Ökosystem eine Schlüsselrolle. Nutzer können über WorldRouter auf 300+ Modelle zugreifen, und Agents können

ChainNewsAbmedia3Std her

Meta entwickelt KI-Assistent Hatch als Konkurrent zu OpenClaw und will die interne Testphase bis Ende Juni abschließen

Laut „Financial Times“ entwickelt Meta derzeit einen KI-Assistenten (Hatch) für die breite Öffentlichkeit, inspiriert von OpenClaw von OpenAI. Ziel ist, die internen Tests bis Ende Juni abzuschließen. Meta plant zudem, noch in diesem vierten Quartal unabhängige Agenten-Tools für den Einkauf in die eigenen Instagram-Dienste zu integrieren.

MarketWhisper4Std her

Cloudflare: Nicht-menschlicher Traffic ist jetzt die Mehrheit, x402-Stiftungsadressen für die Web-Ökonomie

Der Chief Strategy Officer von Cloudflare erklärte, dass mittlerweile mehr als die Hälfte des Internetverkehrs nicht von Menschen stammt, und hob damit einen Wandel in den Nutzungsgewohnheiten des Webs hervor, der durch KI-Agenten getrieben wird. Das Unternehmen verweist auf die x402 Foundation als zentrale Initiative, die Infrastruktur aufbaut, um eine nachhaltige digitale Content-Ökonomie zu unterstützen

CryptoFrontier6Std her

Indische Cybersicherheitsfirmen nutzen KI, um Vulnerability-Tests auf Stunden zu verkürzen

Indische Cybersicherheitsunternehmen, darunter Indusface und Astra Security, setzen KI-Agenten ein, die auf großen Sprachmodellen basieren, um Software-Schwachstellentests von Tagen oder Wochen auf Stunden zu beschleunigen, so The Economic Times. Der Wandel spiegelt die zunehmende Geschwindigkeit von Angreifern und die sich abzeichnende Fähigkeit von KI-Tools wider

CryptoFrontier6Std her

HINT (Hive Intelligence) steigt innerhalb von 24 Stunden um 60,25% stark an

Gate News 消息,6. Mai, laut Gate-Kursdaten lag HINT (Hive Intelligence) zum Zeitpunkt der Veröffentlichung bei 0,001695 US-Dollar. Innerhalb von 24 Stunden stieg der Kurs um 60,25%, erreichte ein Hoch von 0,0019 US-Dollar und fiel auf ein Tief von 0,0010577 US-Dollar zurück. Das 24-Stunden-Handelsvolumen betrug 100.100 US-Dollar. Die aktuelle Marktkapitalisierung liegt bei rund 781.400 US-Dollar. Hive Intelligence ist die grundlegende Infrastruktursschicht für KI-Agents und bietet eine einheitliche Anwendungsprogrammierschnittstelle für Echtzeit-Blockchain-Daten. Dadurch werden Daten-Silos beseitigt, sodass KI-Agents mühelos On-Chain abfragen und interagieren können. Als Krypto-Marktinfrastruktur auf institutionellem Niveau stellt Hive Intelligence über MCP-Endpunkte, REST A

GateNews6Std her
Kommentieren
0/400
Keine Kommentare