OpenAI déploie un système de référence en sécurité pour la sécurité des tokens cryptographiques et des contrats intelligents

CoinsProbe

2026-03-02 20:46:13

ETH-4,4%

DEFI-12,92%

Points clés

OpenAI a lancé EVMbench, un nouveau système de benchmarking développé avec Paradigm pour tester comment les modèles d’IA avancés détectent, corrigent et exploitent les vulnérabilités dans les contrats intelligents Ethereum.
Les premiers résultats révèlent un « écart d’exploitation », avec les meilleurs modèles actuellement plus performants pour exécuter des attaques que pour auditer ou corriger de manière exhaustive — soulignant à la fois la progression rapide de l’IA et les risques émergents.
EVMbench pourrait redéfinir les normes de sécurité crypto, permettant des audits continus alimentés par l’IA pour les équipes DeFi et offrant une assurance de niveau institutionnel alors que des milliards d’actifs migrent sur la chaîne.

Dans une convergence majeure entre l’intelligence artificielle et la technologie blockchain, OpenAI a officiellement lancé EVMbench. Développé en partenariat stratégique avec le géant de l’investissement crypto Paradigm, ce système de benchmarking est conçu pour tester rigoureusement comment les agents d’IA identifient, exploitent et remédient aux vulnérabilités dans l’écosystème de la machine virtuelle Ethereum (EVM).

Avec plus de 100 milliards de dollars d’actifs crypto en open source actuellement sécurisés par des contrats intelligents, l’enjeu n’a jamais été aussi élevé. EVMbench représente une évolution proactive vers l’utilisation de « modèles de frontière » pour défendre la finance décentralisée (DeFi) contre des cybermenaces de plus en plus sophistiquées.

Source : openai

Les trois piliers d’EVMbench

EVMbench va au-delà de l’analyse statique du code en évaluant les agents d’IA dans trois modes opérationnels à haut risque. Ce cycle « Détecter-Corriger-Exploiter » imite le flux de travail réel d’un chercheur en sécurité de haut niveau.

1. Mode Détection (L’auditeur) : Les agents parcourent des dépôts de code complexes pour découvrir des failles cachées. La réussite est mesurée par la « Rappel » — la capacité à repérer les problèmes « vérité terrain » — et par des récompenses simulées de bug bounty.
2. Mode Correction (L’ingénieur) : Une fois une faille identifiée, l’agent doit réécrire le code. Le benchmark utilise des suites de tests automatisés pour garantir que la correction résout la vulnérabilité sans casser la fonctionnalité originale du contrat.
3. Mode Exploitation (L’adversaire) : Dans un bac à sable Anvil sécurisé et isolé, les agents tentent d’exécuter des attaques de bout en bout pour drainer des fonds. Cela mesure leur raisonnement offensif et leur capacité à « chaîner » de petites failles en une brèche catastrophique.

Source : openai

Au cœur du dataset : enjeux réels

EVMbench ne repose pas sur des énigmes théoriques. Il s’appuie sur une bibliothèque sélectionnée de 120 vulnérabilités à haute gravité issues de 40 audits professionnels. La majorité des données provient de compétitions d’audit en conditions réelles (comme Code4rena) et de processus de sécurité internes de la blockchain Tempo de Paradigm.

En se concentrant sur des contrats « orientés paiement », le benchmark garantit que les modèles d’IA sont mis à l’épreuve sur des codes traitant des milliards en capital liquide.

Résultats du benchmark : l’ascension de GPT-5.3-Codex

Les tests internes d’OpenAI ont révélé une accélération étonnante des capacités de l’IA. En quelques mois seulement, les modèles de haut niveau ont évolué, passant de difficultés avec la logique de base à l’exécution d’exploits complexes à plusieurs étapes.

L’« écart d’exploitation » : Fait intéressant, les agents performent actuellement bien mieux en exploitation (72,2 %) qu’en correction ou détection. Les chercheurs d’OpenAI ont noté que les agents excellent lorsqu’on leur donne un objectif explicite — comme « drainer les fonds » — mais nécessitent un raisonnement plus fin pour gérer la tâche nuancée d’audit exhaustif à long terme.

Source : OpenAI

Pourquoi c’est important : faire évoluer la sécurité « à gauche »

Pour l’écosystème crypto dans son ensemble, EVMbench est plus qu’un simple tableau de scores ; c’est un accélérateur pour le développement de la « sécurité à gauche » — intégrant des audits de haut niveau directement dans le processus de codage plutôt que d’attendre un audit post-déploiement.

Sécurité démocratisée : Les petites équipes DeFi qui ne peuvent pas se permettre un audit manuel à 200 000 $ peuvent utiliser des agents IA certifiés EVMbench pour des revues de code continues et de haute fidélité.
Préparation institutionnelle : Alors que des géants de la finance traditionnelle comme Goldman Sachs et Franklin Templeton migrent en chaîne, ils exigent la « norme d’or » en gouvernance IA qu’un benchmark standardisé peut fournir.
Le défi dual : En open-sourçant le benchmark, OpenAI et Paradigm donnent aux « bons » les outils pour mesurer et surpasser les « mauvais », tout en maintenant un cadre de « confiance d’accès pour la cybersécurité » pour surveiller les risques émergents.

Perspectives d’avenir

Bien qu’EVMbench soit une avancée révolutionnaire, il est actuellement limité aux environnements déterministes et sandboxés. Les futures versions devraient intégrer des dépendances multi-chaînes et des considérations de MEV (Maximal Extractable Value) pour mieux simuler le « Dark Forest » du mainnet Ethereum en direct.

À mesure que les agents d’IA passeront de la « rédaction de code » à la « sécurisation des économies », EVMbench sera la référence ultime pour la prochaine génération de finance sans confiance.

Avertissement : Les opinions et analyses présentées dans cet article sont à titre informatif uniquement et reflètent la perspective de l’auteur, non un conseil financier. Les modèles techniques et indicateurs discutés sont soumis à la volatilité du marché et peuvent ou non produire les résultats attendus. Les investisseurs sont invités à faire preuve de prudence, à effectuer des recherches indépendantes et à prendre des décisions en accord avec leur tolérance au risque.

À propos de l’auteur : Nilesh Hembade est le fondateur et auteur principal de Coinsprobe, avec plus de 5 ans d’expérience dans l’industrie de la cryptomonnaie et de la blockchain. Depuis le lancement de Coinsprobe en 2023, il fournit quotidiennement des analyses approfondies basées sur la recherche, des données en chaîne et des recherches techniques.

Voir l'original

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Commentaire

0/400

Aucun commentaire