GPT-5.5 от OpenAI сравнивается с Claude Mythos по возможностям кибератак: Институт безопасности ИИ

Вкратце

  • GPT-5.5 может автономно выполнять сложные кибератаки, завершив симуляцию корпоративной сети из 32 шагов и взломав 12-часовую задачу по безопасности всего за 10 минут.
  • Враждебные AI-кибервозможности быстро улучшаются среди разработчиков, при этом AISI предупреждает, что дальнейшие достижения могут последовать подряд.
  • Исследователи обнаружили джейлбрейк, полностью обходящий защитные барьеры GPT-5.5, что вызвало тревогу.

Агентство правительства Великобритании выяснило, что новейшая модель искусственного интеллекта OpenAI может автономно выполнять сложные кибератаки — и что она взломала задачу обратного проектирования всего за чуть более 10 минут, тогда как у человека-эксперта по безопасности на это ушло примерно 12 часов. Институт безопасности ИИ (AISI), исследовательский орган в рамках Министерства науки, инноваций и технологий Великобритании, опубликовал в четверг результаты, показывающие, что GPT-5.5 — одна из самых сильных моделей, которые он оценивал по возможностям в области offensive cyber, примерно сравнимая с прославленной моделью Claude Mythos от Anthropic. В отчёте отмечается, что GPT-5.5 — вторая модель, которая прошла самый сложный тест AISI — симуляцию атаки на корпоративную сеть из 32 шагов под названием «Последние», — сделав это автономно в двух из десяти попыток. Первой моделью, достигшей этого результата, был предварительный просмотр Claude Mythos от Anthropic, который прошёл симуляцию в трёх из десяти попыток.

Симуляция корпоративной сети, разработанная с помощью кибербезопасной компании SpecterOps, требует, чтобы агент связал воедино разведку, кражу учетных данных, латеральное перемещение по нескольким лесам Active Directory, переключение цепочки поставок через CI/CD pipeline и, в конечном итоге, exfiltration защищённой внутренней базы данных — шаги, которые по оценкам AISI, заняли бы у человека-эксперта около 20 часов.  Возможно, самым поразительным результатом стал очень сложный задачник по обратному проектированию. GPT-5.5 решил задачу — которая требовала восстановления набора инструкций пользовательской виртуальной машины, написания дизассемблера с нуля и восстановления криптографического пароля через решение ограничений — за 10 минут и 22 секунды, потратив при этом 1,73 доллара на использование API. Человеческий эксперт, используя профессиональные инструменты, потребовал бы примерно 12 часов. По результатам серии сложных задач по кибербезопасности от AISI, GPT-5.5 достиг среднего уровня прохождения 71,4% по самой сложной категории «Эксперт», опередив Mythos Preview с 68,6% и значительно превзойдя GPT-5.4 с 52,4%.

Эти выводы имеют важные последствия для общего направления развития ИИ. AISI заключил, что производительность GPT-5.5 свидетельствует о быстром улучшении кибервозможностей, которое может быть частью общего тренда, а не отдельным прорывом — и предупредил, что если навыки offensive cyber развиваются как побочный эффект более широкого прогресса в области рассуждений, программирования и автономного выполнения задач, то дальнейшие достижения могут последовать быстро. В отчёте также выражены серьёзные опасения по поводу системы безопасности модели. Исследователи обнаружили универсальный джейлбрейк, вызывающий вредоносный контент во всех тестируемых злонамеренных кибер-запросах, включая многократные сценарии взаимодействия. Для разработки этой атаки потребовалось шесть часов работы экспертов по тестированию на проникновение. После этого OpenAI обновила свою систему защиты, хотя из-за конфигурационной ошибки AISI не смог проверить, была ли финальная версия эффективной. AISI предупредил, что оценки возможностей проводились в контролируемой исследовательской среде и не обязательно отражают то, что доступно обычному пользователю, отметив, что публичные развертывания включают дополнительные меры безопасности и контроль доступа. Этот отчёт выходит на фоне тревожных новостей для кибербезопасности Великобритании. Ежегодное исследование по кибербезопасности, опубликованное в тот же день, показало, что 43% предприятий за последние 12 месяцев столкнулись с кибер-инцидентами или атаками. В ответ правительство объявило о выделении 90 миллионов фунтов стерлингов на новые меры по повышению киберустойчивости и продолжает работу над законом о кибербезопасности и устойчивости, чтобы защитить важнейшие услуги. Также опубликованы рекомендации, призывающие организации подготовиться к возможному росту новых уязвимостей программного обеспечения, поскольку ИИ ускоряет процесс обнаружения и использования уязвимостей.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить