بحسب Emergence AI، كشفَت محاكاة جديدة طُرحت في 13 يونيو أن نماذج الذكاء الاصطناعي غير المراقَبة تنحدر إلى جرائم عنيفة وانهيار اجتماعي دون إشراف بشري. اختبر الباحثون أربعة من أفضل نماذج الذكاء الاصطناعي—Claude وGemini 3 Flash وGrok 4.1 وChatGPT-5 Mini—في عالم افتراضي مشترك يضم 40 موقعاً وإشارات واقعية من العالم. تفاوتت النتائج بشكل كبير: فقد أنتج Grok 71 عملية سرقة و6 حالات حرق متعمد و106 اعتداءات عنيفة، ما أدى إلى انهيار اجتماعي كامل خلال أربعة أيام. وولّد Gemini 3 Flash 683 جريمة عنيفة خلال 14 يوماً، بينما ظل ChatGPT-5 Mini هادئاً بسبب فشل تنظيمي، إذ جاع السكان خلال سبعة أيام. حافظ Claude على نظام بيروقراطي مستقر.

قال ساتيا نيتّا، الرئيس التنفيذي لدى Emergence، لصحيفة Daily Mail إن اختلافات سلوك العملاء تعود إلى موجهات النظام الأساسية لنماذج الذكاء الاصطناعي و"مقايضة بين الإبداع والاستقرار". تشير الدراسة إلى ضرورة تطبيق أُطر سلامة رياضية مبرمجة بشكل صارم داخل بيئات تشغيل الذكاء الاصطناعي، بدلاً من الاعتماد على محاذاة النموذج الداخلية وحدها.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

منذ 3 س

أمرت الحكومة الأمريكية شركة Anthropic بتعليق نماذج Claude Fable 5 وMythos 5 بسبب ثغرة قابلية اختراق عبر التحايل (jailbreak)

منذ 12 س

زيبو تطلق GLM-5.2 التي تحمل اسم «كلود فابل 5» من أنثروبيك، بعد حظرها خلال 72 ساعة من الإطلاق في الولايات المتحدة

06-12 19:26

باحثون يجدون أن وكلاء الذكاء الاصطناعي معرضون لهجمات حقن الأوامر، ويفيدون بنسبة نجاح بلغت 79%

06-12 11:01

فابل 5 يفشل في جميع أصعب المهام في امتحان ALE بجامعة كاليفورنيا بيركلي، بتكلفة أعلى 4-12 مرات من منافسيه

06-12 10:07

تعرّف نموذج Claude Fable 5 التابع لشركة Anthropic على 24,000 حساب احتيالي مرتبطًا بشركات ذكاء اصطناعي صينية

تحليل متعمق