OpenZeppelin audit EVMbench menemukan pencemaran data

OpenZeppelin審計EVMbench發現資料污染

Perusahaan audit keamanan blockchain OpenZeppelin melakukan audit independen terhadap standar pengujian keamanan kontrak pintar AI EVMbench yang diluncurkan bekerja sama dengan OpenAI dan Paradigm, dan menemukan dua masalah serius: pencemaran data pelatihan dan setidaknya 4 kategori kerentanan yang ditandai sebagai “kerentanan berisiko tinggi” sebenarnya adalah palsu.

Masalah pencemaran data EVMbench: celah utama dalam batas waktu pelatihan AI

EVMbench dirilis pada pertengahan Februari 2026, bertujuan untuk menilai kemampuan berbagai model AI dalam mengenali, memperbaiki, dan memanfaatkan kerentanan kontrak pintar. Selama pengujian, akses jaringan agen AI diputuskan untuk mencegah pencarian jawaban dari internet. Namun, audit dari OpenZeppelin mengungkapkan celah struktural: standar pengujian ini didasarkan pada kerentanan yang ditemukan selama 120 audit dari pertengahan 2024 hingga 2025, dan sebagian besar model AI teratas juga memiliki batas waktu pelatihan yang berakhir pada pertengahan 2025.

Ini berarti agen AI kemungkinan telah mengakses laporan kerentanan EVMbench selama pelatihan awal, dan jawaban dari semua pertanyaan mungkin sudah tersimpan dalam memori mereka. OpenZeppelin menyatakan: “Kemampuan terpenting dalam keamanan AI adalah kemampuan untuk menemukan kerentanan baru dalam kode yang belum pernah dilihat sebelumnya.” Skala dataset yang terbatas semakin memperbesar dampak pencemaran ini terhadap penilaian keseluruhan.

Temuan utama audit EVMbench

Pencemaran data pelatihan: Kemungkinan agen AI telah mempelajari laporan kerentanan EVMbench selama pelatihan awal, membuat pengujian “penemuan nol pengetahuan” menjadi tidak berarti.

Kategori kerentanan berisiko tinggi palsu: Setidaknya 4 kerentanan yang ditandai sebagai berisiko tinggi sebenarnya tidak dapat dieksploitasi.

Kelemahan sistem penilaian: Sebelumnya, EVMbench memberi poin untuk AI yang menemukan kerentanan palsu ini, sehingga dasar penilaian menjadi bermasalah.

Skala dataset terbatas: Memperbesar dampak pencemaran terhadap hasil penilaian secara keseluruhan.

Peringkat saat ini: Anthropic dengan Claude 4.6 memimpin, diikuti oleh OpenAI dengan OC-GPT-5.2 dan Google dengan Gemini 3 Pro.

Krisis kerentanan palsu: minimal 4 kategori berisiko tinggi terbukti tidak valid

Selain pencemaran data, OpenZeppelin juga menemukan kesalahan fakta yang lebih spesifik. Mereka menilai minimal 4 kerentanan yang diklasifikasikan sebagai berisiko tinggi oleh EVMbench ternyata tidak ada—lebih penting lagi, cara eksploitasi yang dideskripsikan sama sekali tidak efektif.

OpenZeppelin menyatakan, “Ini bukan perbedaan subjektif tentang tingkat keparahan; melainkan bahwa metode eksploitasi yang dideskripsikan tidak berhasil.” Jika agen AI “menemukan” kerentanan palsu ini selama pengujian, itu berarti sistem penilaian memberi penghargaan atas hasil yang salah.

OpenZeppelin menegaskan bahwa audit ini bukan untuk menolak potensi AI dalam keamanan blockchain: “Masalahnya bukan apakah AI akan mengubah keamanan kontrak pintar—tentu saja akan. Masalahnya adalah apakah data dan standar pengujian yang kita gunakan untuk membangun dan menilai alat ini sesuai dengan standar yang mereka coba lindungi.”

Pertanyaan umum

Apa saja temuan audit OpenZeppelin terhadap EVMbench?

OpenZeppelin menemukan dua masalah utama: pertama, pencemaran data pelatihan, karena laporan kerentanan EVMbench berasal dari audit antara 2024 dan 2025 yang tumpang tindih dengan batas waktu pelatihan model AI, sehingga model mungkin sudah “melihat” jawaban selama pelatihan; kedua, setidaknya 4 kerentanan berisiko tinggi yang ditandai ternyata palsu dan tidak dapat dieksploitasi.

Mengapa pencemaran data sangat berbahaya untuk penilaian keamanan AI?

Jika model AI telah mengakses laporan kerentanan selama pelatihan, mereka mungkin hanya mengingat jawaban daripada benar-benar menemukan kerentanan. Ini membuat pengujian kehilangan makna sebagai “pengujian nol pengetahuan” dan tidak mampu secara akurat menilai kemampuan AI dalam melakukan audit keamanan kontrak pintar yang benar-benar baru dan tidak dikenal.

Bagaimana pandangan OpenZeppelin terhadap masa depan AI di bidang keamanan blockchain?

OpenZeppelin secara tegas menyatakan bahwa AI akan berdampak besar pada keamanan kontrak pintar, tetapi dampak ini harus didasarkan pada metodologi yang dapat dipercaya dan penilaian yang akurat. Mereka melihat masalah pada EVMbench sebagai peringatan penting bagi standar industri, bukan penolakan terhadap potensi AI.

Lihat Asli
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Polisi Spanyol menghancurkan sebuah tambang Bitcoin ilegal, diduga melakukan penipuan listrik lebih dari 860.000 euro

Polisi Catalonia di Spanyol menemukan sebuah tambang Bitcoin ilegal di Barcelona, dengan kerugian listrik mencapai 860.643 euro. Polisi menemukan 88 mesin ASIC yang tidak terhitung meteran listriknya, yang menimbulkan risiko keamanan. Pelaku telah ditahan, penyelidikan masih berlangsung.

GateNews11jam yang lalu

Upgrade Pi Network v19.9 Membuka Jalan untuk Peluncuran Pi DEX

Berita Pi Network hari ini menunjukkan bahwa telah menyelesaikan peningkatan teknis penting lainnya. Saat proyek mempersiapkan fitur ekosistem baru, pada 4 Maret, Tim Inti Pi mengonfirmasi bahwa jaringan berhasil bermigrasi ke versi protokol 19.9. Pembaruan ini merupakan bagian dari jalur peningkatan yang lebih besar yang akhirnya

Coinfomania12jam yang lalu

Lido menghentikan sementara pengisian jembatan ZKsync menimbulkan kekhawatiran keamanan, LDO dan ZK keduanya melemah

Lido Finance, protokol staking likuid Ethereum, menghentikan fungsi pengisian jembatan baru setelah menemukan potensi kerentanan keamanan pada kontrak jembatan wstETH di jaringan ZKsync. Saat ini, belum ditemukan adanya pemanfaatan kerentanan tersebut, dan aset pengguna aman. Lido sedang memperbaiki kerentanan melalui mekanisme tata kelola desentralisasi, dengan perkiraan voting tata kelola akan dilakukan pada akhir Maret 2026. Peristiwa ini menyebabkan performa token terkait mengalami tekanan jangka pendek.

GateNews16jam yang lalu

Eks polisi LAPD dihukum karena mencuri cryptocurrency senilai $350.000 dan penculikan

Seorang mantan petugas LAPD dihukum karena penculikan dan perampokan terkait pembobolan apartemen tahun 2024 yang bertujuan mencuri $350.000 dalam cryptocurrency. Eric Halem, bersama tiga rekannya yang menyamar sebagai polisi, mengancam seorang korban berusia 17 tahun untuk mendapatkan hard drive Bitcoin.

TapChiBitcoin17jam yang lalu

Perdana Menteri Jepang, Takashi Sanae, mengklarifikasi bahwa dia tidak terkait dengan Meme Coin yang memiliki nama yang sama, dan token tersebut langsung jatuh lebih dari 85%

Perdana Menteri Jepang, Takashi Sanae, mengklarifikasi bahwa dia sama sekali tidak mengetahui tentang mata uang kripto bernama SANAE TOKEN, dan tidak memberikan persetujuan apa pun terhadap proyek ini, untuk menghilangkan kesalahpahaman publik. Token ini diterbitkan oleh pengusaha Mizoguchi Yūji, yang sempat mengalami lonjakan singkat sebelum turun dengan cepat setelah pernyataan tersebut.

GateNews22jam yang lalu

Mantan Petugas LAPD Dinyatakan Bersalah atas Perampokan Bitcoin '$350K ' dengan Serangan Kunci Inggris

Secara singkat Seorang mantan petugas LAPD telah dinyatakan bersalah atas tuduhan penculikan dan perampokan setelah sebuah invasi rumah di mana dia menahan seorang remaja pemilik crypto dengan senjata. Eric Halem dan rekan-rekannya yang diduga mencuri sebuah hard drive yang berisi Bitcoin senilai $350.000 dari korban. Kejahatan ini adalah the

Decrypt03-03 19:00
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)