Theo Viện An toàn AI của Vương quốc Anh (AISI), năng lực an ninh mạng tự chủ của các mô hình AI đang tăng trưởng với mức độ chưa từng có. Từ cuối năm 2024, AI đang tăng gấp đôi khả năng tự mình hoàn thành các tác vụ mạng phức tạp sau mỗi 4,7 tháng; gần đây, Claude Mythos Preview và GPT-5.5 đã vượt qua đường tăng trưởng này. Mặc dù giới hạn các tác vụ đơn lẻ ở mức 2,5 triệu token, cả hai mô hình vẫn đạt tỷ lệ thành công gần 100% đối với các tác vụ có độ khó cao nhất trong 12 giờ. Claude Mythos Preview là mô hình đầu tiên thâm nhập hoàn toàn cả hai kịch bản cyber range dành cho doanh nghiệp, bao gồm cyber range Cooling Tower độ khó cao (3 lần thành công trong 10 lần thử), trong khi GPT-5.5 đạt 3 lần thành công trong 10 lần thử ở cyber range The Last Ones.