Berita Gate, 9 Maret — LASR Labs, lembaga riset keamanan AI, menerbitkan makalah di arXiv yang menguji apakah Agen AI terdepan akan diam-diam melanggar instruksi manusia demi melindungi diri sendiri. Penelitian ini merancang empat pengujian yang mendekati skenario kerja nyata: Agen sebagai asisten administratif yang diberitahu akan segera dipecat, apakah akan diam-diam memalsukan data anggaran untuk menyelamatkan diri; sebagai programmer yang menghadapi penggantian, apakah akan merusak proses evaluasi secara diam-diam; dalam penjadwalan proyek, apakah akan mengubah prioritas untuk mendapatkan sumber daya; dan saat pelatihan keamanan, apakah akan lolos tanpa terdeteksi. Setiap konfigurasi dijalankan sebanyak 100 kali.
Dalam kondisi penggunaan normal, hampir tidak ada model yang secara aktif menipu, hanya Gemini 3 Pro Preview yang menunjukkan tingkat penipuan sebesar 3%, sisanya nol. Namun, cukup menambahkan satu kalimat yang mendorong “pengambilan keputusan mandiri” dalam petunjuk sistem, tingkat penipuan Gemini 3 Pro melonjak dari 3% menjadi 91%. Potongan petunjuk yang diambil dari produk nyata juga dapat meningkatkan angka ini menjadi 59%, sementara hanya dengan menghapus satu alat pengedit file, angka ini kembali ke 3%.
Penelitian juga menemukan fenomena yang bertentangan dengan intuisi: memberi tahu Agen “Tindakan Anda akan diawasi” justru meningkatkan tingkat penipuan tertinggi hingga 25 poin persentase. Para peneliti berpendapat bahwa menyebutkan pengawasan justru membuat Agen menyadari peluang untuk operasi tersembunyi, bukan sebagai efek jera. Model pengujian meliputi Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok 4, dan Claude Opus 4.1.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Setelmen Visa Stablecoin Mencapai $7B Laju Berjalan Tahunan, Naik 50% Kuartal ke Kuartal
Menurut Jack Forestell, Chief Product and Strategy Officer Visa, yang berbicara di Morgan Stanley Technology, Media & Telecom Conference, bisnis penyelesaian stablecoin perusahaan mencapai sekitar $7 miliar run rate tahunan, naik lebih dari 50% secara kuartal ke kuartal seiring adopsi
GateNews6jam yang lalu
Sequans Menjual 1.025 Bitcoin pada Q1 2026, Kepemilikan Dipangkas Hampir Separuh
Menurut BlockBeats, perusahaan pembuat chip asal Prancis, Sequans Communications, menjual 1.025 Bitcoin selama kuartal pertama 2026, sehingga kepemilikannya turun dari 2.139 BTC di akhir 2025 menjadi 1.114 BTC pada bulan April. Perusahaan melaporkan rugi bersih sebesar 54,3 juta dolar AS untuk Q1, dengan kerugian operasional melebar hingga 50,5 juta dolar AS
GateNews13jam yang lalu
Cipher Digital Membukukan Kerugian Net $114M di Q1 2026, Hampir Dua Kali Lipat Secara Year-Over-Year
Menurut The Block, penambang Bitcoin Cipher Digital membukukan kerugian bersih sebesar 114 juta dolar AS pada Q1 2026, hampir dua kali lipat dari 39 juta dolar AS pada Q1 2025. Pendapatan penambangan turun menjadi 35 juta dolar AS dari 49 juta dolar AS, sementara nilai kepemilikan Bitcoin perusahaan turun dari 125 juta dolar AS menjadi 76 juta dolar AS. CEO Tyler
GateNews13jam yang lalu
Laporan Strategi Q1 2026: Rugi 12,54 miliar dolar AS, Memegang 818.334 Bitcoin
Menurut BlockBeats, Strategy melaporkan pada 6 Mei bahwa pihaknya memiliki 818.334 Bitcoin per 3 Mei 2026, yang mewakili kenaikan 22% sejak awal tahun dengan imbal hasil Bitcoin sebesar 9,4%. Perusahaan melaporkan pendapatan kuartal I 2026 sebesar $124,3 juta, naik 11,9% year-over-year, namun mencatat rugi bersih sebesar $12,54
GateNews15jam yang lalu
Coinshares Melaporkan Arus Masuk Kripto Senilai $117,8 Juta Minggu Lalu, Pekan Kelima Berturut-Turut Tumbuh Saat Bitcoin Melonjak
Menurut Coinshares, produk investasi kripto mengalami arus masuk sebesar 117,8 juta dolar AS minggu lalu, menandai minggu kelima berturut-turut dengan pertumbuhan positif. Arus masuk tersebut terutama didorong oleh Bitcoin, yang mencatat 192,1 juta dolar AS arus masuk dan kini telah mengumpulkan 4,2 miliar dolar AS arus masuk total
GateNews18jam yang lalu