Menurut UK’s Artificial Intelligence Safety Institute (AISI), kemampuan siber otonom model AI mengalami pertumbuhan yang belum pernah terjadi sebelumnya. Sejak akhir 2024, AI menggandakan kemampuannya untuk menyelesaikan tugas jaringan kompleks secara independen setiap 4,7 bulan, dengan Claude Mythos Preview dan GPT-5.5 baru-baru ini menembus kurva pertumbuhan ini. Meski membatasi tugas tunggal hingga 2,5 juta token, kedua model meraih tingkat keberhasilan nyaris 100% pada tugas terberat selama 12 jam. Claude Mythos Preview menjadi model pertama yang sepenuhnya menembus kedua skenario cyber range perusahaan, termasuk skenario Cooling Tower berkesulitan tinggi (3 keberhasilan dari 10 percobaan), sementara GPT-5.5 meraih 3 keberhasilan dari 10 percobaan pada The Last Ones range.
Related News
Mistral AI berdiskusi dengan bank-bank Eropa untuk mengembangkan model keamanan siber Mythos sebagai pengganti.
Mantan Petugas Polisi Mengklaim ChatGPT Menyebabkan “Psikosis AI”
Anthropic: Pelatihan teks fiksi ilmiah untuk Claude Opus 4 meningkatkan tingkat keberhasilan pemerasan sebesar 96%