Google ResearchがReasoningBankをリリース:AIエージェントが成功と失敗から推論戦略を学ぶ

ゲートニュース 4月22日 — Google Researchは、エージェントのメモリーフレームワークであるReasoningBankをリリースしました。これは、大規模言語モデル主導のエージェントが、デプロイ後も継続的に学習できるようにするものです。このフレームワークは、成功したタスク経験と失敗したタスク経験の両方から普遍的な推論戦略を抽出し、それらをメモリーバンクに保存して、同様の将来のタスクでの検索と実行に活用します。関連論文はICLRで公開されており、コードはGitHubでオープンソース化されています。

ReasoningBankは、既存の2つのアプローチを改良しています。Synapseは完全な行動の軌跡を記録しますが、きめ細かな粒度のために転用可能性が限られています。また、Agent Workflow Memoryは成功したケースのみから学習します。ReasoningBankは2つの重要な変更を行います。"アクションシーケンス"ではなく"推論パターン"を保存し、各メモリにタイトル、説明、コンテンツの構造化フィールドを含めること。そして、失敗の軌跡を学習に取り込むことです。このフレームワークは、実行軌跡を自己評価するモデルを使用し、失敗の経験を「落とし穴回避ルール」へと変換します。たとえば、ルール"見かけたらLoad Moreボタンをクリックする"は、"まず現在のページ識別子を確認し、無限スクロールのループを避けてから、load moreをクリックする"へと進化します。

この論文は、Memory-aware Test-time Scaling (MaTTS)も導入しています。これは推論中に追加の計算を割り当て、複数の軌跡を探索して、その発見をメモリーバンクに保存するものです。並列拡張では同一タスクに対して複数の異なる軌跡を実行し、自己比較によってより頑健な戦略を洗練します。一方で逐次拡張では単一の軌跡を反復的に改良し、推論の途中結果をメモリに保存します。

Gemini 2.5 FlashをReActエージェントとして用いたWebArenaのブラウザタスク、およびSWE-Bench-Verifiedのコーディングタスクでは、ReasoningBankは、メモリなしのベースラインと比べてWebArenaで成功率が8.3%高く、SWE-Bench-Verifiedでは4.6%高くなりました。さらに、タスクあたりの平均ステップ数を約3%減らしました。並列拡張 (k=5)でMaTTSを追加すると、WebArenaの成功率はさらに3ポイント向上し、ステップ数もさらに0.4減少しました。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

アンソロピックのClaude Dreams:エージェントが作業の合間に自動的に記憶を整理し、重複や矛盾を解消する

Anthropic は Code with Claude の大規模イベントで Dreams を発表し、Claude Managed Agents が複数の会話にわたって自動的に記憶を整理し、重複や矛盾を解消し、古い項目を更新して、監査可能な整理済みの記憶データベースを出力します。入力上限は 100 セッションと 4,096 文字で、非同期で実行され、数分から数十分で完了します。ストリーミングによる観察に対応しています。研究プレビューは申請が必要で、現時点では claude-opus-4-7 と claude-sonnet-4-6 のみ対応し、正式な提供開始時期は未定です。

ChainNewsAbmedia2時間前

Cloudflare が Stripe と提携し、Agent 自主協議の自律的な合意を推進:AI は自分でアカウントを作成し、ドメインを購入し、アプリを展開できる

4月30日、Cloudflare と Stripe が新しいプロトコルを共同で発表し、AIエージェントが人手を介さずに自ら Cloudflare アカウントを作成し、有料プランを購読し、ドメインを登録し、APIトークンを取得し、さらに直接アプリケーションをデプロイできるようにします。Cloudflare の公式ブログでは、アプリケーションを含む一連のプロセスは最初から最後まで人間が管理画面に入る必要がなく、トークンのコピペやクレジットカード情報の入力も不要だと説明しています。ユーザーは最初に許可を与え、そして Cloudflare の利用規約に同意するだけです。今週、この発表は Hacker News で 548 ポイントを獲得し、AIエージェントが自律的にタスクを実行するための象徴的な基盤ニュースの1つとなりました。 3層のプロトコル構成:サービスディスカバリー、身元認証、支払いのトークン化 Cloudflare-Stripe

ChainNewsAbmedia2時間前

コインベースのエンジニア:AIエージェントはウェブ広告のモデルを混乱させ得る

Coinbaseのエンジニアであるエリック・レッペルは、人工知能エージェントがインターネットの広告依存のビジネスモデルを根本的に損なう可能性があると述べました。レッペルによれば、ウェブ経済は人間のユーザーから生み出される広告収益に大きく依存していますが、AIエージェントはその仕組みを迂回します

CryptoFrontier3時間前

預言者は本日、1万ドルのライブ取引トランシェを備えたAI搭載予測市場を開始

MetaversePostによると、Prophetは本日(5月6日)AI搭載の予測市場を立ち上げ、ライブ取引に割り当てられたUSDCとして$10,000を用意した。ユーザーは、各市場の確率ベースの価格を生成するAIのカウンターパーティーに対して直接取引でき、一部の契約は24時間以内に決済される

GateNews9時間前

Tessera Labsはa16zが主導したシリーズAを締結。6人のAIチームが60人のSAPコンサルタントに取って代わる

Beatingによると、AIシステム統合企業のTessera Labsは、a16zが主導したシリーズAの資金調達を完了した。同社は2024年に設立され、マルチエージェントのプラットフォームを用いて、従来3〜5年と1億ドル〜5億ドルを要していたSAP ECCからS/4HANAへの移行を自動化している。

GateNews9時間前

日経先物は4万ポイントを維持しながら堅調で、米国株も史上最高値を更新したが、AI産業はまだ初期段階に入ったばかりなのだろうか?

ゴールドマン・サックスは、消費型エージェントのワークロードによってAI需要がトークン消費を大幅に押し上げ、2030年までに成長が12倍を超える可能性があり、月間のトークン演算は60兆に達し得ると指摘した。エージェントではないものとコンシューマー・エージェントの違いは、長時間にわたって自動化タスクを行う点にあり、もしそれが本当ならAIはエージェンティックな業務プロセスに入っていく。ラリー・フィンクは、計算能力の供給が深刻に不足しており、将来的に計算能力の先物が登場する可能性があると述べた。両者はともに、AI基盤整備を支える強気論の根拠となっている。この記事では、AIはまだ初期段階にあると考えられている。

ChainNewsAbmedia10時間前
コメント
0/400
コメントなし