OpenAI、暗号トークンとスマートコントラクトのセキュリティ向けにセキュリティベンチマークシステムを導入

CoinsProbe
ETH5.15%
DEFI1.67%


重要ポイント

  • OpenAIは、Paradigmと共同で開発した新しいベンチマークシステム「EVMbench」を発表しました。これは、先進的なAIモデルがEthereumスマートコントラクトの脆弱性を検出、修正、悪用する方法をテストするものです。

  • 初期の結果は「エクスプロイトギャップ」を示しており、現時点ではトップモデルは攻撃の実行に優れる一方、脆弱性の包括的な監査や修正には遅れをとっていることが明らかになっています。これは、AIの急速な進歩と新たなリスクを浮き彫りにしています。

  • EVMbenchは暗号セキュリティの基準を再定義し、DeFiチームによる継続的なAI監査を可能にし、資産がオンチェーン上で動く中、機関レベルの保証を提供する可能性があります。


人工知能とブロックチェーン技術の大きな融合の中、OpenAIは正式にEVMbenchをリリースしました。暗号投資大手のParadigmと戦略的パートナーシップを結び、Ethereum Virtual Machine(EVM)エコシステム内の脆弱性をAIエージェントが識別、悪用、修復する能力を厳格にテストするためのベンチマークシステムです。

現在、スマートコントラクトによって保護されているオープンソースの暗号資産は1000億ドルを超え、そのリスクはかつてないほど高まっています。EVMbenchは、「フロンティアモデル」を活用して、分散型金融(DeFi)を高度化したサイバー脅威から守るための積極的なシフトを示しています。

出典:openai

EVMbenchの三つの柱

EVMbenchは静的コード解析を超え、三つの重要な運用モードでAIエージェントを評価します。この「検出-修正-悪用」サイクルは、一流のセキュリティ研究者の実務フローを模倣しています。

  • 1. 検出モード(監査者): エージェントは複雑なコードリポジトリをスキャンし、隠れた脆弱性を発見します。成功は「リコール」(真の問題を見つける能力)と、シミュレーションされたバグバウンティ報酬によって測定されます。

  • 2. 修正モード(エンジニア): 脆弱性を発見したら、エージェントはコードを書き換えます。ベンチマークは自動テストスイートを用いて、修正が脆弱性を解消しつつ、コントラクトの元の機能を損なわないことを確認します。

  • 3. 悪用モード(敵対者): 安全な隔離環境のAnvilサンドボックス内で、エージェントは資金を流し出すエンドツーエンドの攻撃を試みます。これにより、攻撃者の攻撃的推論能力と、小さな欠陥を連鎖させて大規模な侵害に至る能力が測定されます。

出典:openai

データセットの裏側:実世界のリスク

EVMbenchは理論的なパズルに基づいているのではなく、40件のプロフェッショナル監査から収集された120の高重大度脆弱性を厳選したライブラリに基づいています。多くは実際の監査コンペ(例:Code4rena)やParadigmの内部セキュリティプロセスから得られたものです。

「支払い重視」のコントラクトに焦点を当てることで、AIモデルは数十億ドルの流動資本を扱うコードに対して実戦的なテストを受けています。

ベンチマーク結果:GPT-5.3-Codexの台頭

OpenAIの内部テストでは、AIの能力が驚くほど加速していることが明らかになっています。わずか数ヶ月で、トップモデルは基本的な論理処理から複雑な多段階のエクスプロイトの実行へと進化しています。

「エクスプロイトギャップ」: 興味深いことに、エージェントは現在、悪用(72.2%)においては、_修正_や_検出_よりも著しく高いパフォーマンスを示しています。OpenAIの研究者は、エージェントは「資金を流し出す」など明確な目標を与えられると優れるが、詳細な監査のような長期的かつ微妙なタスクにはより洗練された推論が必要だと指摘しています。

出典:Openai

重要性:セキュリティの「左側」シフト

暗号エコシステム全体にとって、EVMbenchは単なるスコアカード以上のものです。それは**「セキュリティ・レフト」**の開発を促進し、エリートレベルの監査をコーディング段階に直接組み込むことを可能にします。

  • 民主化されたセキュリティ: 20万ドルの手動監査ができない小規模DeFiチームも、EVMbench認証済みのAIエージェントを使って継続的に高精度なコードレビューを行えます。

  • 機関の準備: ゴールドマン・サックスやフランクリン・テンプルトンなどの伝統的金融機関がオンチェーンに進出する中、標準化されたベンチマークが「ゴールドスタンダード」のAIガバナンスを提供します。

  • デュアルユースの課題: ベンチマークをオープンソース化することで、OpenAIとParadigmは「善意のプレイヤー」にツールを提供し、「悪意のプレイヤー」を測定・追い越すことを可能にしつつ、サイバーリスクを監視する「信頼できるアクセス」フレームワークも維持しています。

今後の展望

EVMbenchは革新的な一歩ですが、現状は決定論的でサンドボックス化された環境に限定されています。将来的にはマルチチェーン依存性や**MEV(最大抽出可能価値)**の考慮を取り入れ、ライブのEthereumメインネットの「ダークフォレスト」をより正確にシミュレートすることが期待されます。

AIエージェントが「コードを書く」から「経済を守る」へと進化する中、EVMbenchは次世代の信頼不要な金融のための決定的な基準となるでしょう。


免責事項: 本記事の見解や分析は情報提供を目的としたものであり、投資アドバイスを意図したものではありません。記載された技術的パターンや指標は市場の変動性に左右され、期待通りの結果を保証するものではありません。投資家は自己責任で慎重に判断し、独自の調査を行うことを推奨します。


著者について: ニレシュ・ヘンバデはCoinsprobeの創設者兼リード著者であり、暗号通貨とブロックチェーン業界で5年以上の経験を持ちます。2023年にCoinsprobeを立ち上げて以来、詳細な市場分析、オンチェーンデータ、技術調査を通じて日々の洞察を提供しています。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし