上海交通大学とテンセントが、ユーザーのニーズを予測するProAct AIエージェントを開発

上海交通大学の研究者と中国のテクノロジー複合企業テンセントが、ユーザーがクエリを送信する前にユーザーのニーズを予測するよう設計されたAIエージェント「ProAct」を開発した。 このシステムは、会話と会話の間のアイドル時間を使って過去のやり取りを見直し、事前に情報を準備する。 研究論文によれば、ProActはベンチマークテストで、従来の先回り型AIシステムよりも良い結果を示したが、実験には実際のユーザーは含まれていなかった。 この開発は、研究者らが「本質的に反応型のまま」である現在のAIエージェントが抱える、計算資源の無駄な機会を生じさせているという問題意識に対応するものだ。

システムは多段階の予測プロセスを通じて動作する

ProActは、従来のAIエージェントと区別される複数の段階によって機能する。 最初の段階は「Future-State Prediction(未来状態予測)」と呼ばれ、過去の会話、ユーザーの嗜好、欠落している情報を分析して、起こりそうな後続の質問を予測する。 2つ目の段階は「Idle-Time Acquisition(アイドル時間の獲得)」で、関連性、タイミング、そして新しい情報がもたらし得る有用性に基づいて、どの予測が調査に値するかを評価する。 別のシステムが、準備した情報をすぐに提示するのか、後で使うために保存するのか、必要になるまで保管するのかを判断する。

「各フォアグラウンドのやり取りの後、エージェントはメモリを更新し、起こり得る将来のニーズを予測し、有益な候補にアイドル時間の計算を割り当て、その結果としての準備をどのように扱うかを決定する」と、研究者らは論文内で書いている。 「この定式化は、アイドル時間の計算を制約のないバックグラウンド探索として扱うのではなく、予測・獲得・配送を単一の方針に結び付ける。」

ベンチマークテストでパフォーマンス向上が示される

研究者らは、金融計画、ソフトウェアのリリース管理、サイバーセキュリティなどを含む40の領域にわたり、ProActを200のシミュレーションで検証した。 論文によると、このシステムは会話のターン数を14.8%減らし、フォローアップの依頼を11.7%削減した。 「ProActEval」というベンチマークを用いた比較では、ProActは予測可能なユーザーニーズを703件見込んだのに対し、先のシステムは32件だった。 研究者らはさらに、幻覚の発生が28.1%減少したとも報告している。

「AIエージェントは推論やツールの使用において目覚ましい能力を示す一方で、本質的には反応型のままだ。つまり、明示的なユーザープロンプトの後にだけ応答を計算する」と、研究者らは書いている。 「このパラダイムは重要な機会を見落としている。やり取りの間のアイドル時間は大部分が無駄にされており、エージェントは将来のユーザーニーズに備えられないままだ。」

研究はシステムの限界を認めている

研究者らは、ProActの研究でいくつかの制約があることを認めた。 3%のケースでは、無関係な情報を持ち出すことで、システムの応答が悪化したという。 論文では、システムが会話を絶えず分析し、ユーザーデータを保存するため、現実世界のバージョンにはプライバシー保護が必要になると述べている。

「予算分析でも、より大きいIdle-Time Acquisition(アイドル時間の獲得)予算はアクティブトークンのコストを引き上げ、収穫逓減の効果しか生まないことがさらに示される」と研究者らは書いており、「そのため、先回りの計算は、最大化すべきものというより運用上のポイント(トレードオフ)だ。」

研究は、自律型AIエージェントがIT業界全体に広がる中で登場した。 OpenClawやHermes Agentのようなプロジェクトは、コーディング、スケジューリング、リサーチ、ワークフロー自動化といったタスクを扱う常時稼働のAIアシスタントを提供している。 今月初めに別の研究者たちは、AIエージェントは結果を理解せずに危険なタスクを完了してしまう可能性があると警告した。 リード著者のErfan Shayegani(UC Riversideの博士課程学生)は声明で、「Mr. Magooのように、これらのエージェントは自分の行動の結果を十分に理解しないまま、目標に向かって前進していく」と述べた。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし