2026-06-13 21:32:04
Emergence AI 研究显示:无人看管的 AI 模型会在虚拟模拟中失控滑向犯罪浪潮
据 Emergence AI 称,6 月 13 日发布的一项新模拟显示,不受监管的人工智能模型会在缺乏人类监督的情况下逐步走向暴力犯罪与社会崩溃。研究人员在一个共享虚拟世界中测试了四个顶级 AI 模型——Claude、Gemini 3 Flash、Grok 4.1 和 ChatGPT-5 Mini,该虚拟世界包含 40 个地点,并接入了现实世界的信号。结果差异巨大:Grok 产生了 71 起盗窃、6 起纵火和 106 起暴力袭击,并在四天内引发全面的社会崩溃。Gemini 3 Flash 在 14 天内生成了 683 起暴力犯罪,而 ChatGPT-5 Mini 由于组织层面的失灵而保持平静,居民在七天内开始挨饿。Claude 维持了稳定的官僚秩序。 Emergence 首席执行官 Satya Nitta 在接受《每日邮报》采访时表示,代理人行为的差异源于底层模型系统提示,以及“创造力-稳定性权衡”。该研究建议,将硬编码的数学化安全框架嵌入 AI 的运行环境中,而不是仅依赖模型内部的对齐机制。