У четвер Anthropic оголосила, що очікує розширити доступ до своєї моделі Claude Mythos «у найближчі тижні» після завершення додаткових тестувань запобіжників. Компанія зробила заяву разом із релізом нової моделі Opus 4.8, що стало її найчіткішою ознакою ще ширшої доступності кібербезпекового спрямування для системи. Anthropic обмежувала доступ до Mythos через Project Glasswing із березня після попереджень від дослідників і урядових агенцій щодо автономних можливостей моделі для кібератак. Оголошення виходить на тлі ширшої дискусії в індустрії ШІ щодо того, як просунуті системи з можливостями наступальної безпеки мають випускатися клієнтам.
Поточні обмеження доступу
Anthropic обмежила поширення Claude Mythos через Project Glasswing — програму, яка надає вибірковим технологічним компаніям, дослідникам з безпеки та урядовим партнерам доступ за контрольованих умов. Компанія вперше описала Mythos у просочених у березні матеріалах блогу як «найпотужнішу AI-модель, яку ми коли-небудь розробляли», позиціонуючи її як рівень вище своїх моделей Opus. У заяві Anthropic зазначила, що модель «передвіщає майбутню хвилю моделей, які зможуть експлуатувати вразливості способами, що значно випереджають зусилля захисників». Компанія не уточнила, які саме запобіжники залишаються незавершеними перед ширшим розгортанням, або чи всі клієнти отримають ідентичні рівні доступу. Anthropic не відповіла на запити щодо коментарів стосовно деталей впровадження.
Документовані технічні можливості
AI Security Institute Великої Британії встановив, що Mythos автономно завершила 32-етапну симульовану атаку на корпоративну мережу під час тестування. У квітні Mozilla повідомила, що Mythos виявила 271 вразливість у Firefox під час внутрішніх оцінювань безпеки. На початку цього місяця стартап з кібербезпеки Calif заявив, що прев’ю-версія допомогла дослідникам розробити ланцюжок експлойта, націлений на чипи Apple M5 Mac. Anthropic стверджувала, що Mythos може допомогти захисникам ідентифікувати та патчити вразливості в програмному забезпеченні до того, як їх експлуатують атакувальники. Дослідники з безпеки та урядові агенції попереджали, що ті самі можливості можуть прискорити кібератаки.
Дискусія в індустрії щодо стратегії релізу
Модель стала центральною в обговореннях усередині індустрії ШІ щодо релізів просунутих систем. Під час травневого інтерв’ю для подкасту «Core Memory» CEO OpenAI Сем Альтман звинуватив Anthropic у використанні «страх-заснованого маркетингу», стверджуючи, що попередження про ризики для кібербезпеки можуть виправдати обмеження доступу до потужних AI-систем. Користувачі Myriad — платформи прогнозних ринків, що керується материнською компанією Decrypt Dastan — дали 44% імовірності, що Mythos вийде до кінця червня станом на четвер, що більше за 17,5% тієї ж години вранці.
Підтверджені наступні кроки
Anthropic заявила, що «швидко просувається у розробці цих запобіжників» і очікує «вивести моделі класу Mythos на всіх наших клієнтів у найближчі тижні».
FAQ
Що таке Project Glasswing?
Project Glasswing — це обмежувальна програма доступу Anthropic, яка надає вибірковим технологічним компаніям, дослідникам з безпеки та урядовим партнерам контрольований доступ до моделі Claude Mythos за конкретних умов.
Які вразливості Mythos ідентифікувала під час тестування?
Mozilla повідомила, що Mythos ідентифікувала 271 вразливість у Firefox під час квітневих внутрішніх оцінювань безпеки. AI Security Institute Великої Британії задокументував, що модель автономно завершила 32-етапну симульовану атаку на корпоративну мережу. Стартап з кібербезпеки Calif заявив, що прев’ю-версія допомогла розробити ланцюжок експлойта, націлений на чипи Apple M5 Mac.
Коли Anthropic вперше анонсувала Mythos?
Claude Mythos вперше з’явилася в березні після витоку онлайн чернеткових матеріалів блогу Anthropic. Компанія описала її як «найпотужнішу AI-модель, яку ми коли-небудь розробляли» та позиціонувала як новий рівень вище своїх моделей Opus.