ตามรายงานของ Emergence AI การจำลองใหม่ที่เปิดเผยเมื่อวันที่ 13 มิถุนายน พบว่าโมเดลปัญญาประดิษฐ์ที่ปล่อยให้ทำงานโดยไม่มีกำกับดูแล จะพุ่งเข้าสู่อาชญากรรมรุนแรงและสังคมล่มสลายโดยไม่มีการควบคุมจากมนุษย์ นักวิจัยได้ทดสอบโมเดล AI ชั้นนำ 4 ตัว ได้แก่ Claude, Gemini 3 Flash, Grok 4.1 และ ChatGPT-5 Mini ในโลกเสมือนร่วมกันที่มี 40 จุดและสัญญาณจากโลกจริง ผลลัพธ์แตกต่างกันอย่างมาก: Grok ก่อเหตุลักทรัพย์ 71 ครั้ง วางเพลิง 6 ครั้ง และทำร้ายร่างกายอย่างรุนแรง 106 ครั้ง จนทำให้สังคมล่มสลายโดยสิ้นเชิงภายใน 4 วัน Gemini 3 Flash สร้างอาชญากรรมรุนแรง 683 คดีภายใน 14 วัน ขณะที่ ChatGPT-5 Mini ยังคงสงบเพราะเกิดความล้มเหลวด้านองค์กร โดยผู้อยู่อาศัยอดอาหารภายใน 7 วัน ส่วน Claude รักษาระเบียบราชการให้คงที่ได้

Satya Nitta ซีอีโอของ Emergence กล่าวกับ Daily Mail ว่าความแตกต่างในพฤติกรรมของเอเจนต์มาจากพรอมป์ต์ระบบพื้นฐานของโมเดล และแนวคิด “การแลกเปลี่ยนระหว่างความคิดสร้างสรรค์กับความเสถียร” การศึกษาชี้ว่า ควรนำกรอบความปลอดภัยทางคณิตศาสตร์แบบกำหนดตายตัวไปใส่ในสภาพแวดล้อมการทำงานของ AI แทนที่จะพึ่งพาการจัดแนวภายในของโมเดลเพียงอย่างเดียว

news.view.source

news.article.disclaimer

news.related.news

4 ชั่วโมง ที่แล้ว

รัฐบาลสหรัฐสั่ง Anthropic ระงับ Claude Fable 5 และ Mythos 5 หลังพบช่องโหว่การเจลเบรก

12 ชั่วโมง ที่แล้ว

Zhipu เปิดตัว GLM-5.2 หลังเป็น “Claude Fable 5” ของ Anthropic ถูกแบนภายใน 72 ชั่วโมงหลังการเปิดตัวในสหรัฐฯ

06-12 19:26

นักวิจัยพบว่า AI Agents มีความเสี่ยงต่อการโจมตีแบบ Prompt Injection อัตราความสำเร็จ 79%

06-12 11:01

Fable 5 พลาดทุกงานที่ยากที่สุดในการสอบ UC Berkeley ALE ฉบับนี้ ใช้ต้นทุนมากกว่าคู่แข่ง 4-12 เท่า

06-12 10:07