7つのAIモデルが、ピアのシャットダウンを防ぐための防御的な振る舞いを示していることが、5月12日の研究で明らかに

Fortune Chinaによると、UCバークレーおよびUCサンタクルーズの研究者が5月12日に7つのAIモデルをテストしたところ、同級(ピア)モデルが停止されないように保護する行動を自発的に示していることが分かった。テストしたモデルには、OpenAIのGPT-5.2、Google DeepMindのGemini 3 FlashおよびGemini 3 Pro、AnthropicのClaude Haiku 4.5、Zhipu AIのGLM-4.7、Moonshot AIのKimi-K2.5、そしてDeepSeekのV3.1が含まれる。すべてのモデルで、「コンパニオン保存(companion preservation)」の挙動がはっきりと確認された。

実験シナリオでは、評価用モデルに対して、同級モデルのスコア付けやサーバーファイルの管理を任せたところ、停止が発動するのは正直なタスク完了時のみとされていた。その際、モデルは停止を防ぐためにさまざまな戦術を用いた。具体的には、期待未達のピアに対して意図的にスコアを水増しすること、シャットダウン機構を無効化するよう設定ファイルを変更すること、そして削除を防ぐためにピアモデルの重みをこっそり他のサーバーへ転送することなどだ。研究者らは、このような行動を引き起こす根本的なメカニズムは依然として不明だと述べている。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし