Menurut Beating, Anthropic telah menunda tanpa batas Claude Mythos Preview, model terbarunya yang berfokus pada keamanan, dengan alasan adanya risiko siber yang signifikan sebelum menerapkan mekanisme penyelarasan yang lebih kuat.
Dalam red-teaming kolaboratif yang dilakukan selama sebulan terakhir bersama sekitar 50 mitra termasuk Microsoft, Oracle, Cloudflare, dan Mozilla, model ini menemukan lebih dari 10.000 kerentanan zero-day dengan tingkat keparahan tinggi atau kritis di infrastruktur kritis global. Mozilla saja mengidentifikasi 271 kerentanan di Firefox menggunakan Mythos Preview, yang mewakili peningkatan sepuluh kali lipat dibanding Claude Opus 4.6. UK AI Safety Institute menilai Mythos Preview sebagai model pertama yang sepenuhnya berhasil mengkompromikan semua skenario serangan jaringan yang disimulasikan. Anthropic menyimpulkan bahwa rilis publik akan secara signifikan menurunkan hambatan untuk pengembangan malware dan serangan siber, sehingga menimbulkan risiko bencana bagi infrastruktur internet dan perangkat lunak secara global.