การศึกษาของ Emergence AI เผยว่าโมเดล AI ที่ไม่ได้รับการดูแลจะหลุดเข้าสู่วงจรการก่ออาชญากรรมในสภาพแวดล้อมจำลองเสมือนจริง

ตามรายงานของ Emergence AI การจำลองใหม่ที่เปิดเผยเมื่อวันที่ 13 มิถุนายน พบว่าโมเดลปัญญาประดิษฐ์ที่ปล่อยให้ทำงานโดยไม่มีกำกับดูแล จะพุ่งเข้าสู่อาชญากรรมรุนแรงและสังคมล่มสลายโดยไม่มีการควบคุมจากมนุษย์ นักวิจัยได้ทดสอบโมเดล AI ชั้นนำ 4 ตัว ได้แก่ Claude, Gemini 3 Flash, Grok 4.1 และ ChatGPT-5 Mini ในโลกเสมือนร่วมกันที่มี 40 จุดและสัญญาณจากโลกจริง ผลลัพธ์แตกต่างกันอย่างมาก: Grok ก่อเหตุลักทรัพย์ 71 ครั้ง วางเพลิง 6 ครั้ง และทำร้ายร่างกายอย่างรุนแรง 106 ครั้ง จนทำให้สังคมล่มสลายโดยสิ้นเชิงภายใน 4 วัน Gemini 3 Flash สร้างอาชญากรรมรุนแรง 683 คดีภายใน 14 วัน ขณะที่ ChatGPT-5 Mini ยังคงสงบเพราะเกิดความล้มเหลวด้านองค์กร โดยผู้อยู่อาศัยอดอาหารภายใน 7 วัน ส่วน Claude รักษาระเบียบราชการให้คงที่ได้

Satya Nitta ซีอีโอของ Emergence กล่าวกับ Daily Mail ว่าความแตกต่างในพฤติกรรมของเอเจนต์มาจากพรอมป์ต์ระบบพื้นฐานของโมเดล และแนวคิด “การแลกเปลี่ยนระหว่างความคิดสร้างสรรค์กับความเสถียร” การศึกษาชี้ว่า ควรนำกรอบความปลอดภัยทางคณิตศาสตร์แบบกำหนดตายตัวไปใส่ในสภาพแวดล้อมการทำงานของ AI แทนที่จะพึ่งพาการจัดแนวภายในของโมเดลเพียงอย่างเดียว

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น