وفقاً لمعهد سلامة الذكاء الاصطناعي في المملكة المتحدة (AISI)، يشهد تطور القدرات السيبرانية الذاتية لنماذج الذكاء الاصطناعي نمواً غير مسبوق. منذ أواخر 2024، يتضاعف أداء الذكاء الاصطناعي في إكمال مهام شبكية معقدة بشكل مستقل كل 4.7 أشهر، إذ نجح كل من Claude Mythos Preview وGPT-5.5 مؤخراً في تجاوز منحنى هذا النمو. وعلى الرغم من وضع حدّ للمهام الفردية عند 2.5 مليون رمز، حقق النموذجان معدلات نجاح قريبة من 100% في مهام مدتها 12 ساعة ذات أعلى مستوى صعوبة. أصبح Claude Mythos Preview أول نموذج يخترق بالكامل سيناريوهين لمدى السيبرانية الخاصين بالمؤسسات، بما في ذلك نطاق Cooling Tower عالي الصعوبة (3 نجاحات من 10 محاولات)، بينما حقق GPT-5.5 3 نجاحات من 10 محاولات على نطاق The Last Ones.
Related News