OpenZeppelin auditoria EVMbench descobre contaminação de dados

OpenZeppelin審計EVMbench發現資料污染

A empresa de auditoria de segurança de blockchain OpenZeppelin realizou uma auditoria independente ao padrão de teste de IA de segurança de contratos inteligentes EVMbench, lançado em colaboração com OpenAI e Paradigm, e identificou duas questões graves: contaminação de dados de treino e pelo menos 4 vulnerabilidades marcadas como “alto risco” que, na realidade, são falsificações inválidas.

Problema de contaminação de dados do EVMbench: uma vulnerabilidade crítica na data de corte do treino de IA

O EVMbench foi lançado em meados de fevereiro de 2026, com o objetivo de avaliar a capacidade de diferentes modelos de IA em identificar, corrigir e explorar vulnerabilidades de contratos inteligentes. Durante os testes, o acesso à internet dos agentes de IA foi bloqueado para evitar buscas online por respostas. No entanto, a auditoria da OpenZeppelin revelou uma falha estrutural: o padrão de teste baseia-se em vulnerabilidades identificadas em 120 auditorias realizadas entre 2024 e meados de 2025, período em que a maioria dos principais modelos de IA também teve seu conhecimento treinado até essa data.

Isso significa que os agentes de IA provavelmente tiveram acesso às vulnerabilidades do EVMbench durante seu pré-treinamento, armazenando as respostas na memória. A OpenZeppelin afirmou: “A habilidade mais importante de segurança de IA é descobrir vulnerabilidades em códigos que o modelo nunca viu antes.” A limitação do tamanho do conjunto de dados aumenta ainda mais o impacto da contaminação na avaliação geral.

Principais problemas identificados na auditoria do EVMbench

  • Contaminação de dados de treino: o pré-treinamento dos agentes de IA pode incluir relatórios de vulnerabilidades do EVMbench, tornando a avaliação de “descoberta zero” sem sentido.
  • Classificação inválida de vulnerabilidades de alto risco: pelo menos 4 vulnerabilidades marcadas como de alto risco são, na verdade, inexploráveis.
  • Defeitos no sistema de pontuação: o EVMbench anteriormente atribuía pontos às descobertas dessas vulnerabilidades falsas, o que compromete a validade da avaliação.
  • Tamanho limitado do conjunto de dados: amplifica o impacto da contaminação nos resultados globais.
  • Classificação atual no ranking: Claude 4.6 da Anthropic lidera, seguido por OC-GPT-5.2 da OpenAI e Gemini 3 Pro do Google.

Crise de vulnerabilidades falsas: pelo menos 4 classificações de alto risco comprovadamente inválidas

Além da contaminação de dados, a OpenZeppelin identificou erros mais específicos. Avaliaram pelo menos 4 vulnerabilidades marcadas como de alto risco pelo EVMbench, que na realidade não existem — e, mais importante, suas descrições de exploração são inviáveis.

A OpenZeppelin afirmou: “Não se trata de uma divergência subjetiva de gravidade; as vulnerabilidades descritas simplesmente não funcionam.” Se um agente de IA “descobrir” essas vulnerabilidades falsas durante o teste, isso indica que o sistema de avaliação recompensa resultados incorretos.

A empresa destacou que esta auditoria não nega o potencial da IA na segurança de blockchain: “O problema não é se a IA mudará a segurança dos contratos inteligentes — ela certamente mudará. O problema é se os dados e padrões que usamos para construir e avaliar essas ferramentas estão alinhados com os padrões que eles pretendem proteger.”

Perguntas frequentes

O que a OpenZeppelin descobriu na auditoria do EVMbench?

A OpenZeppelin identificou duas questões principais: primeiro, a contaminação de dados, pois os relatórios de vulnerabilidades do EVMbench vêm de auditorias entre 2024 e 2025, período em que os modelos de IA também tiveram seu conhecimento treinado até lá, podendo já ter “visto” as respostas; segundo, pelo menos 4 vulnerabilidades marcadas como de alto risco que, na verdade, são falsas, pois suas explorações descritas não funcionam.

Por que a contaminação de dados é tão perigosa para a avaliação de segurança de IA?

Se o modelo de IA foi treinado com relatórios de vulnerabilidades do padrão, ele pode simplesmente “lembrar” as respostas, em vez de realmente identificar vulnerabilidades. Isso compromete a validade do teste de “zero conhecimento”, não refletindo a capacidade real do IA de auditar contratos inteligentes desconhecidos.

Qual é a postura da OpenZeppelin sobre o futuro da IA na segurança de blockchain?

A OpenZeppelin afirmou que a IA terá um impacto significativo na segurança de contratos inteligentes, mas esse impacto deve ser baseado em metodologias confiáveis e avaliações precisas. Eles veem os problemas do EVMbench como um alerta importante para o setor, não uma negação do potencial da IA.

Ver original
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

O Ledger Donjon Encontra Falha no MediaTek Expondo Sementes da Carteira Android

_Ledger Donjon expôs uma vulnerabilidade do MediaTek que extrai frases de recuperação de carteiras Android em menos de 45 segundos, afectando milhões de dispositivos. CVE-2025-20435._ Ledger Donjon descobriu uma grave vulnerabilidade do MediaTek. Permite que atacantes extraiam frases de recuperação de carteiras de telemóveis Android em segundos.

LiveBTCNews59m atrás

Autoridades Congelam $3.5M em Cripto enquanto Europol e DOJ Interrompem Rede Proxy 'SocksEscort'

Em resumo A Europol e parceiros anunciaram a interrupção do serviço de proxy malicioso "SocksEscort" e o congelamento de $3,5 milhões em criptomoedas ligadas à operação. A rede alegadamente comprometeu mais de 369.000 routers e dispositivos IoT e ofereceu aos clientes mais de 35.000 p

Decrypt1h atrás

Relatório CertiK: Perdas com Fraudes em Caixas Eletrônicos de Criptomoedas Atingem 333 Milhões de Dólares em 2025, Tecnologia de IA Intensifica Escalada Criminal

CertiK divulgou um relatório mostrando que as perdas por fraude em caixas eletrónicos de criptomoedas nos EUA em 2025 atingiram 3.3 mil milhões de dólares, com um crescimento de 33%. Os métodos de fraude estão a evoluir gradualmente, com idosos como alvo principal. As fraudes impulsionadas por IA têm uma capacidade de lucro 4.5 vezes superior aos métodos tradicionais, e a ameaça de organizações criminosas transnacionais continua a aumentar.

GateNews6h atrás

A China Artificial Intelligence Industry Development Alliance continua a acompanhar os riscos de segurança do OpenClaw e elaborou um guia de gestão de riscos de implementação a nível empresarial

Gate News notícia, 12 de março, a China Artificial Intelligence Industry Development Alliance está a acompanhar continuamente a dinâmica dos riscos de segurança do OpenClaw e a elaborar um guia de gestão de riscos para a implementação empresarial do OpenClaw.

GateNews6h atrás

A Tencent lançou a caixa de ferramentas de segurança OpenClaw para enfrentar os desafios de segurança do Agente de IA Lobster

A Tencent lançou no dia 12 de março o OpenClaw Security Toolkit, visando enfrentar os desafios de segurança trazidos pelos AI Agents, fornecendo proteção em múltiplas camadas para empresas e utilizadores. O toolkit inclui soluções de segurança para a cloud e computadores pessoais, suportando isolamento de ambiente e monitorização de comandos anómalos.

GateNews6h atrás

Hack do Bonk.fun Exõe Utilizadores da Solana a Ataque de Drenagem de Carteira

Especialistas em segurança descobriram código malicioso no Bonk.fun que expôs utilizadores a potenciais ataques de drenagem de carteira. No entanto, especialistas em segurança expressaram receios de que utilizadores de sites descentralizados permaneçam

TheNewsCrypto8h atrás
Comentário
0/400
Sem comentários