根據 Jack Clark 在牛津大學的演說,Anthropic 的聯合創辦人警告,人工智慧可能實現遞迴式自我改進——即能夠自主升級自身並創造更先進版本——有可能在 2028 年或更早。Clark 承認,Anthropic 本身已顯著低估了 AI 進步的速度,且對先進模型所帶來的風險準備不足。
Clark 以 Mythos 為例:這是一個於 2026 年 4 月完成的內部模型,作為這些風險的證據。該模型具備與國家層級網路攻擊武器相當的能力。鑑於其具毀滅性潛力,Anthropic 已無限期禁止公開釋出 Mythos,僅限少數機構為軟體弱點研究用途提供存取。