OpenAI совместно с Paradigm запускает EVMbench, тестирование возможностей AI-агентов в защите и атаке смарт-контрактов EVM, выявляя слабые стороны и сильные стороны.
Лидер в области искусственного интеллекта OpenAI объявил о сотрудничестве с известной компанией по рисковым инвестициям в криптовалюты Paradigm и компанией по безопасности OtterSec для запуска EVMbench — инструмента для оценки безопасности AI-агентов в контексте смарт-контрактов Ethereum Virtual Machine (EVM).
По мере углубления интеграции AI и криптотехнологий, смарт-контракты становятся ключевой инфраструктурой для управления более чем триллионом открытых криптоактивов. Появление этого инструмента символизирует начало осознания индустрией практических возможностей AI в условиях «экономически значимой среды».
Команда OpenAI отмечает, что с ростом возможностей AI-агентов в написании и планировании кода, в будущем эти модели будут играть трансформирующую роль в атаках и защите блокчейна. Поэтому создание стандартизированной системы оценки становится критически важным для мониторинга прогресса AI.
Ядро EVMbench построено на базе 120 уязвимостей, извлечённых из 40 профессиональных аудиторских отчётов, включая известные публичные конкурсы по аудиту Code4rena, что обеспечивает реалистичность сценариев. Стандарт включает три режима оценки AI-агентов:
Источник: OpenAI EVMbench — ядро системы заключается в оценке AI-агентов в трёх режимах работы
Для обеспечения строгой повторяемости и надёжности тестирования команда разработала архитектуру на базе Rust, использующую детерминированное воспроизведение транзакций для проверки успешности атак или исправлений AI.
В первых результатах тестирования видно, что AI показывает значительные различия в эффективности в зависимости от задачи. Новое поколение GPT-5.3-Codex показывает отличные результаты в режиме эксплуатации (Exploit Mode), набрав 72,2 %, что значительно превосходит показатели GPT-5, выпущенной всего шесть месяцев назад (31,9 %), демонстрируя поразительный рост возможностей.
Источник: Обзор результатов различных моделей AI OpenAI в трёх режимах
Это свидетельствует о том, что при ясной цели «вывести средства из системы» AI обладает мощными возможностями по планированию и выполнению атак. Однако в защитных сценариях показатели остаются слабее: AI часто останавливается после обнаружения одной уязвимости и не продолжает поиск, а при исправлении сложных логик зачастую не удаётся устранить уязвимость без нарушения работы контракта. Эксперты по безопасности выражают обеспокоенность, что AI может значительно сократить время от обнаружения уязвимости до разработки атаки, что повышает требования к скорости защиты DeFi-проектов.
Помимо разработки инструментов, OpenAI активно занимается привлечением специалистов и укреплением экосистемы защиты. Недавно был нанят основатель проекта открытых AI-агентов OpenClaw Питер Штайнбергер, который возглавит разработку следующего поколения персонализированных агентов и преобразует проект в фонд, поддерживаемый OpenAI.
Для противодействия возможным киберрискам, связанным с AI, OpenAI обещает выделить 10 миллионов долларов на гранты по кибербезопасности через свою программу поддержки, чтобы финансировать разработку открытых инструментов защиты и исследование ключевой инфраструктуры. Эта инициатива особенно актуальна после инцидента с протоколом Moonwell, где из-за ошибки в коде, связанной с AI, было потеряно около 1,78 миллиона долларов.
Дополнительные материалы
Отказ от миллиардных предложений Meta, создатель OpenClaw присоединяется к борьбе за таланты в OpenAI, предсказания о сбоях в протоколе Moonwell — кто заплатит за убытки в 1,78 миллиона долларов?
В будущем, по мере внедрения более автоматизированных и AI-ассистированных платежных решений и автоматизированных кошельков, использование таких инструментов, как EVMbench, для различения моделей, способных только описывать уязвимости, и моделей, способных надёжно обеспечивать защиту, станет ключевым моментом в развитии индустрии блокчейн-безопасности.
Связанные статьи
Майнер Bitcoin MARA заявил, что может продать свои запасы BTC в рамках стратегического изменения
XRP Ledger Developer Spotlight: крупнейший пул ликвидности RLUSD - стимул - U.Today
Ripple нацелен на традиционный банковский сектор с масштабным расширением сервиса Ripple Payments, ориентированного на XRP - U.Today
Chainlink расширяет экосистему, интегрируя 16 сервисов на шести платформах и пяти блокчейнах
Физическое золото + блокчейн — открытие новой эры международных платежей, партнеры узла CNX PAY официально запускаются 5 марта
Американский биткойн-трейдинг братьев Трампа увеличивает мощность майнинга после убытков в 4 квартале