ニュース速報メッセージ:4月23日 — Perplexityの研究チームが、Web検索エージェント向けのポストトレーニング手法の詳細を説明する技術記事を公開しました。このアプローチは、2つのオープンソースのQwen3.5モデル (Qwen3.5-122B-A10B と Qwen3.5-397B-A17B) を使用し、2段階のパイプラインを採用します。すなわち、命令追従と言語の一貫性を確立するための教師あり微調整 (SFT) の後に、検索精度とツール使用の効率を最適化するためのオンライン強化学習 (RL) を行います。
RLフェーズでは、GRPOアルゴリズムを2つのデータソースとともに活用します。1つは、内部のシードクエリから構築された独自のマルチホップ検証可能な質問-回答データセットで、推論の2〜4ホップと、複数ソルバによる検証を必要とします。もう1つは、配備要件を客観的に検査可能な原子的条件へ変換してSFTの振る舞い劣化を防ぐ、ルーブリックに基づく汎用会話データです。
報酬設計では、ゲート付き集約を採用します——ベースラインの正しさが達成された場合にのみ、選好スコアが寄与します (question-answer match または すべてのルーブリック基準が満たされた場合)。これにより、高い選好信号が事実誤りを覆い隠すことを防ぎます。効率ペナルティは同一グループ内のアンカーリングを用い、同じグループにおける正答のベースラインを超えて、ツール呼び出しや生成長に対してなめらかなペナルティを適用します。
評価では、Qwen3.5-397B-SFT-RLが検索ベンチマーク全体で業界最高水準の性能を達成しています。FRAMESでは、単一ツール呼び出しで57.3%の精度を実現し、GPT-5.4を5.7パーセントポイント上回ります。また、Claude Sonnet 4.6を4.7パーセントポイント上回ります。中程度の予算 (4回のツール呼び出し) では、1クエリあたり$0.02で73.9%の精度を達成し、GPT-5.4の1クエリあたり$0.085での67.8%の精度、Sonnet 4.6の1クエリあたり$0.153での62.4%の精度と比較しています。コスト数値は各提供元の公開API料金に基づき、キャッシュの最適化は除外されています。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
OpenClaw は 4 月 29 日に v2026.4.29 をリリースし、関係追跡付きのパーソナライズされた Wiki にメモリをアップグレードします
Beatingによると、オープンソースのAIアシスタント「OpenClaw」(GitHub 367Kスター)が2026.4.29を4月29日にリリースし、2日間で2回目のアップデートとなりました。記憶システムは、単純な検索ベースの想起からパーソナライズされたwikiへと進化し、エージェントが自動的にキャラクタープロフィールを作成し、追跡できるようになりました
GateNews3時間前
GoogleのCEO、ピチャイがGemini AIを活用して人間性を見抜き、より誠実なコミュニケーションを築くことを明かした
ピチャイは重要な会議の前に、Geminiの視点で相手の心理を分析・予測することで、共感力を高め、より誠実なコミュニケーションにつなげたと述べた。AIエージェントもまた、自動でメール、スケジュール、要約を整理できるため、日々の細かな用事がより効率化される。さらに、オープンな共創を中核に据えたAIプラットフォームが台頭しており、Gemini 4 などのオープンソース技術が参入のハードルを下げている。同時に、AIガバナンスの枠組みを構築することを重視しており、政治界と社会が参加して、サイバーセキュリティ、ディープフェイク、そしてサステナビリティなどの課題を解決する必要がある。
ChainNewsAbmedia5時間前
Oobitは木曜日にVisa対応のAIエージェントカードを発表し、法定通貨への両替なしでUSDTの支払いを可能にする
The Blockによると、Tether(テザー)に裏付けられたウォレットのスタートアップOobitは木曜日にAIエージェントカードをローンチし、USDT残高を使って自律型ボットが購入を行えるようにした。フィアットへ両替したり、企業カードの認証情報に直接アクセスしたりすることなく実行できる。Visaに対応したカードは、Visaが利用可能なオンライン環境で使用できるところまで
GateNews6時間前
ChimpX AI、Waterdrip CapitalとMetaLabs Venturesが主導するシードラウンドで280万ドルを調達
ChimpX AIは本日、Mojo AIの開発を加速するための$2.8 millionのシードラウンドのクローズを発表しました。Mojo AIは、平文の英語による意図をSolana上のオンチェーンDeFi取引へ変換する実行エージェントです。このラウンドはWaterdripが主導しました
GateNews8時間前
主要なCEXが4月29日にエージェント決済プロトコルをローンチし、AI主導のクロスチェーン取引を可能にする
最近の発表によると、主要な暗号資産取引所が4月29日にエージェント決済プロトコルを公開した。これはオープンスタンダードであり、人間の介入なしに人工知能エージェントが複数のブロックチェーンネットワークにまたがって完全なビジネス取引を実行できるようにする。プロトコル
GateNews8時間前
セイウチがAIエージェントのメモリ向けMemWal SDKをローンチ
ウォルラスは、Mysten Labs GroupのプロダクトマネージャーであるAbinhav Gargによると、AIエージェントが情報を保存しアクセスする方法において、検証可能性、可用性、移植性、共有可能性をもたらすことで、エージェント型メモリの制約に対処することを目的としたSDKであるMemWalをローンチしました。
検証可能で移植可能なメモリ
CryptoFrontier9時間前