米国政府は金曜日、潜在的なジェイルブレイクの脆弱性に関する国家安全保障上の懸念を理由に、Anthropicに対し同社の最も強力なAIモデル2つ――Claude Fable 5 と Claude Mythos 5――へのアクセスを、外国籍の人全員に対して直ちに停止するよう緊急の輸出管理の指令を出した。この指令は、米国内外を問わず外国籍の人によるモデルへのアクセスを禁じており、コンプライアンスを確実にするため、Anthropicは自社の全顧客向けにモデルを無効化せざるを得なかった。両モデルはほんの数日前にリリースされたばかりで、Mythos 5は、そのようなサイバーセキュリティの脆弱性を発見する能力ゆえに、選ばれた提携先にのみ提供されていた。
政府指令でClaude Fable 5とMythos 5へのアクセスが停止
金曜日に出された緊急の輸出管理指令は、米国外内を問わず、いかなる外国籍の人も Claude Fable 5 と Claude Mythos 5 にアクセスすることを禁じた。この命令の広範な適用範囲によって、Anthropicはコンプライアンスを確保するため、自社の全顧客基盤でモデルを無効化するよう追い込まれた。
その書簡は国家安全保障上の懸念について具体的な詳細を提示しなかったが、政府は公に利用可能な Fable 5 モデルを回避、いわゆる「ジェイルブレイク」する方法を把握するに至ったと考えている。ガードレールがより少なく、サイバーセキュリティ上の脆弱性を発見することに特に強い Mythos 5 は、選ばれた提携先にのみ提供されていた。
他のすべての Anthropic モデルへのアクセスは影響を受けない。同社は、可能な限り早くアクセスを復旧するために取り組んでいると述べた。
Anthropic、ジェイルブレイクの重大性の指摘に異議
Anthropicは、指摘の重大性に異議を唱えた。同社は、その手法のデモを見直したうえで、特定された脆弱性は比較的単純に見えると結論づけ、またバイパスを必要とせずとも他の公に利用可能なモデルでもそれらを発見できるとしている。
同社は、政府がこれまでに提示してきたのは、潜在的に限定的な、非ユニバーサルなジェイルブレイクであるという口頭の証拠だけだと述べた。要するに、モデルに特定のコードベースを読み取らせ、ソフトウェア上の不具合を修正させることから成る。さらにAnthropicは、表示された能力の水準は、OpenAIのGPT-5.5を含む競合モデルからもすでに広く入手可能であることを検証したと付け加えた。
同指令に従いながら、Anthropicはこの行動が危険な前例を作るものだと考えているという。「もしこの基準が業界全体に適用されるなら」と同社は書いた。「それは、実質的に、あらゆるフロンティア・モデル提供者による新しいモデルの配備をすべて停止させることになると考えています。」
David Sacks、停止に関する政府の見解を詳述
土曜日、President's Council of Advisers on Science and Technology の共同議長である David Sacks は X で、「Fable を試験していた、Anthropic と米国政府の両方の高度に信頼できる提携先」が、そうしたガードレールに対するジェイルブレイクを持ち込んだと述べた。管理者は [Anthropic CEO Dario Amodei] に対し、ジェイルブレイクを直すか、あるいはモデルのデプラオイ(再配備停止)を求めた。しかし Dario はそれを拒否した。」
Sacks はさらに、政府からの要請に対する Anthropic の反応は、AIの安全と規制の必要性に関して同社自身が公に主張してきた内容と食い違っていると訴えた。この見解は、今週のブログ投稿でも Amodei が再び共有した。
「Anthropic は安全よりも消費者向けモデルの提供を優先した」と Sacks は書いた。「それに反応して管理者は輸出管理を発動した。管理者は、それを渋々行った。Anthropic が(つまりジェイルブレイクの問題を修正するという)妥当な安全要請に協力したがっていないことには、非常に驚いている。彼らの反応は、安全なAI研究コミュニティとしての彼らのブランディングや理念と、まさに不一致だ。」
Sacks は、政権は Anthropic に問題を直してほしいと考えており、Fable 5 が再び一般公開に戻ることを望んでいるとも付け加えた。「この問題は重大ではあるものの、容易に解決できるはずだと感じている」と彼は書いた。「あとは Anthropic 側の番です。」
Anthropic と米国政府の間での先行する緊張
今年の初め、Anthropic と米国政府は、AI企業が、米国民に対する大規模な国内監視と、完全に自律した致死性兵器システムを可能にする拡大合意への署名を拒否したことで対立した。
Donald Trump 大統領は会談が決裂したあと同社を非難し、国防総省は Anthropic を「サプライチェーン上のリスク」と位置付けた――この指定は同社が裁判で争っている。それ以来、政府が Claude Mythos やその他のモデルを活用しようとしたことで、両者の対立が冷え込んだとの報道もある。
FAQ
米国政府は金曜日に Anthropic に何をするよう命じましたか?
米国政府は金曜日、Anthropicに対し、潜在的なジェイルブレイクの脆弱性に関する国家安全保障上の懸念を理由に、外国籍の人全員について Claude Fable 5 と Claude Mythos 5 へのアクセスを直ちに停止するよう緊急の輸出管理の指令を出しました。
なぜ Anthropic は政府のジェイルブレイクの指摘に異議を唱えるのですか?
Anthropic は、その手法のデモを見直し、特定された脆弱性は比較的単純に見える一方で、バイパスを必要とせずとも OpenAI の GPT-5.5 を含む他の公に利用可能なモデルでもそれらを発見できると結論づけました。
Anthropic と米国政府の間には、これまでどんな緊張がありましたか?
今年の初め、Anthropic は米国民に対する大規模な国内監視と、完全に自律した致死性兵器システムを可能にする拡大合意への署名を拒否し、その結果、国防総省が Anthropic を「サプライチェーン上のリスク」とラベル付けしました――この指定は同社が裁判で争っていることです。