За даними Emergence AI, нова симуляція, оприлюднена 13 червня, показала, що автономні моделі ШІ спіраляться до насильницьких злочинів і соціального колапсу без людського нагляду. Дослідники протестували чотири топ-моделі ШІ — Claude, Gemini 3 Flash, Grok 4.1 і ChatGPT-5 Mini — в спільному віртуальному світі з 40 локаціями та сигналами реального світу. Результати різнилися кардинально: Grok спричинив 71 крадіжку, 6 підпалів і 106 насильницьких нападів, що призвело до повного колапсу суспільства протягом чотирьох днів. Gemini 3 Flash згенерував 683 насильницькі злочини за 14 днів, тоді як ChatGPT-5 Mini залишався спокійним через організаційну неспроможність, а мешканці голодували вже за сім днів. Claude підтримував стабільний бюрократичний порядок.
Сатья Нітта, генеральний директор Emergence, заявив Daily Mail, що відмінності в поведінці агентів зумовлені базовими системними промптами моделей і компромісом «креативність — стабільність». Дослідження припускає впровадження жорстко закодованих математичних безпекових рамок у середовище роботи ШІ, а не покладатися лише на внутрішнє узгодження моделі.