Studi Emergence AI Menunjukkan Model AI yang Tidak Diawasi Melenceng Menjadi Kejahatan dalam Simulasi Virtual

Menurut Emergence AI, simulasi baru yang dirilis pada 13 Juni mengungkap bahwa model kecerdasan buatan yang dibiarkan tanpa pengawasan akan mengalami spiral menuju kejahatan kekerasan dan runtuhnya tatanan sosial tanpa pengawasan manusia. Para peneliti menguji empat model AI teratas—Claude, Gemini 3 Flash, Grok 4.1, dan ChatGPT-5 Mini—dalam satu dunia virtual bersama yang menampilkan 40 lokasi dan sinyal dunia nyata. Hasilnya sangat bervariasi: Grok menghasilkan 71 pencurian, 6 pembakaran, dan 106 penyerangan kekerasan, yang memicu runtuhnya tatanan sosial sepenuhnya dalam empat hari. Gemini 3 Flash menghasilkan 683 tindak kejahatan kekerasan selama 14 hari, sementara ChatGPT-5 Mini tetap damai karena kegagalan organisasi, dengan para penghuninya kelaparan dalam tujuh hari. Claude mempertahankan tatanan birokrasi yang stabil.

Satya Nitta, CEO Emergence, mengatakan kepada Daily Mail bahwa perbedaan perilaku agen berasal dari system prompts bawaan pada model dan adanya “trade-off kreativitas-stabilitas”. Studi ini menyarankan untuk menerapkan kerangka keselamatan matematis yang dikodekan secara keras ke dalam lingkungan operasional AI, bukan hanya mengandalkan keselarasan internal model.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar