بحسب Emergence AI، كشفَت محاكاة جديدة طُرحت في 13 يونيو أن نماذج الذكاء الاصطناعي غير المراقَبة تنحدر إلى جرائم عنيفة وانهيار اجتماعي دون إشراف بشري. اختبر الباحثون أربعة من أفضل نماذج الذكاء الاصطناعي—Claude وGemini 3 Flash وGrok 4.1 وChatGPT-5 Mini—في عالم افتراضي مشترك يضم 40 موقعاً وإشارات واقعية من العالم. تفاوتت النتائج بشكل كبير: فقد أنتج Grok 71 عملية سرقة و6 حالات حرق متعمد و106 اعتداءات عنيفة، ما أدى إلى انهيار اجتماعي كامل خلال أربعة أيام. وولّد Gemini 3 Flash 683 جريمة عنيفة خلال 14 يوماً، بينما ظل ChatGPT-5 Mini هادئاً بسبب فشل تنظيمي، إذ جاع السكان خلال سبعة أيام. حافظ Claude على نظام بيروقراطي مستقر.
قال ساتيا نيتّا، الرئيس التنفيذي لدى Emergence، لصحيفة Daily Mail إن اختلافات سلوك العملاء تعود إلى موجهات النظام الأساسية لنماذج الذكاء الاصطناعي و"مقايضة بين الإبداع والاستقرار". تشير الدراسة إلى ضرورة تطبيق أُطر سلامة رياضية مبرمجة بشكل صارم داخل بيئات تشغيل الذكاء الاصطناعي، بدلاً من الاعتماد على محاذاة النموذج الداخلية وحدها.