OpenAI запроваджує систему оцінки безпеки для безпеки криптовалютних токенів та смарт-контрактів

CoinsProbe

2026-02-27 20:31:32

ETH1,53%

DEFI-9,73%

Ключові висновки

OpenAI запустила EVMbench — нову систему бенчмаркінгу, розроблену разом із Paradigm, для тестування здатності передових моделей штучного інтелекту виявляти, виправляти та використовувати вразливості в смарт-контрактах Ethereum.
Перші результати показують “Розрив у Exploit Gap”: найкращі моделі наразі краще виконують атаки, ніж всебічно аналізують або виправляють помилки — що підкреслює швидкий прогрес ШІ та зростаючі ризики.
EVMbench може змінити стандарти безпеки у криптоіндустрії, забезпечуючи безперервний аудит за допомогою ШІ для команд DeFi та надаючи інституційний рівень гарантій, оскільки на блокчейн переходять мільярди активів.

У важливому злитті штучного інтелекту та технологій блокчейн OpenAI офіційно запустила EVMbench. Розроблений у стратегічному партнерстві з гігантом криптоінвестицій Paradigm, цей бенчмарк-система створена для ретельного тестування здатності ШІ-агентів виявляти, використовувати та усувати вразливості в екосистемі Ethereum Virtual Machine (EVM).

З понад 100 мільярдами доларів у відкритих криптоактивах, захищених смарт-контрактами, ставки ніколи не були вищими. EVMbench є проактивним кроком у напрямку використання “frontier models” для захисту децентралізованих фінансів (DeFi) від все більш витончених кіберзагроз.

Джерело: openai

Три стовпи EVMbench

EVMbench виходить за межі статичного аналізу коду, оцінюючи ШІ-агентів у трьох високоризикових режимах роботи. Цикл “Виявлення-Виправлення-Використання” імітує реальний робочий процес провідного фахівця з безпеки.

1. Режим виявлення (Аудитор): Агент сканує складні репозиторії коду, щоб знайти приховані вразливості. Успіх вимірюється за показником “Recall” — здатністю знаходити “правдиві” проблеми — та симульованими нагородами за баг-баунті.
2. Режим виправлення (Інженер): Після виявлення помилки агент переписує код. Бенчмарк використовує автоматизовані тестові комплекти, щоб переконатися, що виправлення усуває вразливість і не порушує функціональність контракту.
3. Режим використання (Агресор): У безпечній ізольованій пісочниці Anvil агенти намагаються виконати повномасштабні атаки для виведення коштів. Це оцінює їхню здатність до наступальної логіки та “ланцюгового” використання дрібних помилок у масштабних порушеннях.

Джерело: openai

Внутрішній аналіз: реальні ставки

EVMbench базується не на теоретичних головоломках, а на ретельно відібраній бібліотеці з 120 високоризикових вразливостей, отриманих із 40 професійних аудитів. Більша частина даних походить із реальних конкурсів аудитів (наприклад, Code4rena) та внутрішніх процесів безпеки Paradigm у блокчейні Tempo.

Зосереджуючись на “платіжних” контрактах, бенчмарк гарантує, що моделі ШІ проходять випробування на коді, що обробля мільярди вільних капіталів.

Результати бенчмарку: зростання GPT-5.3-Codex

Внутрішні тести OpenAI показали вражаюче прискорення можливостей ШІ. За кілька місяців провідні моделі пройшли шлях від базових логічних задач до виконання складних багатоступеневих експлойтів.

“Розрив у Exploit Gap”: цікаво, що моделі зараз значно краще виконують експлуатацію (72,2%), ніж виявлення або виправлення. Дослідники OpenAI зазначили, що агенти добре справляються з чітко поставленою одноразовою метою — наприклад, “зняти кошти”, — але потребують більш тонкого мислення для комплексного аудиту з довгим хвостом завдань.

Джерело: Openai

Чому це важливо: зміщення безпеки “вліво”

Для ширшої криптоекосистеми EVMbench — це не просто оцінка, а прискорювач розвитку “Security-Left” — інтеграції висококласного аудиту безпосередньо у процес кодування, а не після розгортання.

Демократизація безпеки: Малі команди DeFi, які не можуть дозволити собі ручний аудит за 200 тис. доларів, можуть використовувати ШІ-агенти, сертифіковані EVMbench, для безперервних високоточних перевірок коду.
Інституційна готовність: Оскільки гіганти традиційних фінансів, такі як Goldman Sachs і Franklin Templeton, переходять у блокчейн, їм потрібен “золотий стандарт” управління ШІ, який забезпечує стандартизований бенчмарк.
Двонапрямна проблема: Відкриваючи вихідний код бенчмарку, OpenAI і Paradigm надають “хорошим хлопцям” інструменти для вимірювання та випередження “поганих”, зберігаючи при цьому рамки “Довіреного доступу для кібербезпеки” для моніторингу нових ризиків.

Погляд у майбутнє

Хоча EVMbench є революційним кроком, наразі він обмежений детермінованими, ізольованими середовищами. Очікується, що майбутні версії враховуватимуть мульти-ланцюгові залежності та MEV (Maximal Extractable Value) для кращого моделювання “Темного лісу” живого Ethereum.

Якщо ШІ-агенти перейдуть від “писання коду” до “захисту економік,” EVMbench стане головним орієнтиром для наступного покоління безпечних фінансів без довіри.

Застереження: Усі думки та аналізи, наведені в цій статті, є суто інформаційними і не слугують фінансовою порадою. Технічні патерни та індикатори можуть залежати від ринкової волатильності і не гарантують очікуваних результатів. Інвесторам рекомендується проявляти обережність, проводити незалежне дослідження та приймати рішення відповідно до свого рівня ризику.

Про автора: Нілеш Хембаде — засновник і головний автор Coinsprobe, має понад 5 років досвіду у криптовалютній та блокчейн-індустрії. З моменту запуску Coinsprobe у 2023 році він щодня надає аналітичні огляди, дослідження на основі ринку, дані з блокчейну та технічні дослідження.

Переглянути оригінал

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Прокоментувати

0/400

Немає коментарів