
La compañía de auditoría de seguridad en blockchain OpenZeppelin realizó una auditoría independiente del estándar de seguridad de contratos inteligentes AI EVMbench, lanzado en colaboración entre OpenAI y Paradigm, y encontró dos problemas graves: contaminación de datos de entrenamiento y al menos 4 vulnerabilidades clasificadas como “alto riesgo” que en realidad son falsos exploits.
Problema de contaminación de datos en EVMbench: una vulnerabilidad clave en la fecha límite de entrenamiento de AI
EVMbench fue lanzado a mediados de febrero de 2026, con el objetivo de evaluar la capacidad de diferentes modelos de IA para identificar, reparar y explotar vulnerabilidades en contratos inteligentes. Durante las pruebas, el acceso a internet del agente de IA fue bloqueado para evitar que buscara respuestas en línea. Sin embargo, la auditoría de OpenZeppelin reveló una vulnerabilidad estructural: la prueba se basa en vulnerabilidades filtradas en 120 auditorías realizadas entre 2024 y mediados de 2025, y la mayoría de los modelos de IA de punta tienen su fecha límite de entrenamiento en 2025.
Esto significa que es muy probable que los agentes de IA hayan visto los informes de vulnerabilidades de EVMbench durante su preentrenamiento, almacenando en su memoria las respuestas a todas las preguntas. OpenZeppelin afirmó: «La capacidad más importante en seguridad de IA es descubrir nuevas vulnerabilidades en código que el modelo nunca haya visto antes». La escala limitada del conjunto de datos amplifica aún más el impacto de la contaminación en la evaluación general.
Problemas clave detectados en la auditoría de EVMbench
- Contaminación de datos de entrenamiento: El preentrenamiento del IA puede incluir informes de vulnerabilidades de EVMbench, haciendo que las pruebas de “descubrimiento sin conocimiento” pierdan sentido.
- Clasificación de vulnerabilidades de alto riesgo inválidas: Al menos 4 vulnerabilidades marcadas como de alto riesgo no son explotables.
- Defectos en el sistema de puntuación: EVMbench anteriormente otorgaba puntos por descubrimientos de exploits falsos, lo que cuestiona la validez de la evaluación.
- Escala limitada del conjunto de datos: Esto amplifica el impacto de la contaminación en los resultados.
- Clasificación actual en el ranking: Claude 4.6 de Anthropic lidera, seguido por OC-GPT-5.2 de OpenAI y Gemini 3 Pro de Google.
Crisis de falsos exploits: al menos 4 vulnerabilidades de alto riesgo confirmadas como inválidas
Además de la contaminación de datos, OpenZeppelin encontró errores específicos. Evaluaron al menos 4 vulnerabilidades clasificadas como de alto riesgo en EVMbench y descubrieron que en realidad no existen, y lo más importante, que las descripciones de los exploits no funcionan en la práctica.
OpenZeppelin señaló: «No se trata de una diferencia subjetiva en la gravedad; sino de que los exploits descritos no funcionan». Si el agente de IA “descubre” estos falsos exploits en las pruebas, significa que el sistema de puntuación está premiando resultados incorrectos.
Destacaron que esta auditoría no niega el potencial de la IA en la seguridad blockchain: «El problema no es si la IA cambiará la seguridad de los contratos inteligentes —seguramente lo hará—, sino si los datos y estándares que usamos para construir y evaluar estas herramientas están alineados con los contratos que buscan proteger».
Preguntas frecuentes
¿Qué problemas encontró OpenZeppelin en la auditoría de EVMbench?
Detectaron dos problemas principales: primero, la contaminación de datos de entrenamiento, ya que los informes de vulnerabilidades utilizados en EVMbench provienen de auditorías entre 2024 y 2025, fechas que coinciden con el entrenamiento de muchos modelos de IA, quienes podrían haber “visto” esas respuestas previamente; segundo, al menos 4 vulnerabilidades de alto riesgo son falsos exploits, cuyas descripciones y métodos de ataque no funcionan en realidad.
¿Por qué la contaminación de datos es tan peligrosa para la evaluación de seguridad de IA?
Si el modelo de IA ha visto los informes de vulnerabilidades en su entrenamiento, puede responder basándose en memoria en lugar de detectar realmente vulnerabilidades nuevas. Esto hace que la evaluación pierda su propósito de “prueba de conocimiento cero”, y no refleje la capacidad real del IA para auditar contratos inteligentes desconocidos y nuevos.
¿Qué postura tiene OpenZeppelin respecto al futuro de la IA en la seguridad blockchain?
OpenZeppelin afirmó claramente que la IA tendrá un impacto significativo en la seguridad de los contratos inteligentes, pero enfatizó que ese impacto debe basarse en metodologías confiables y evaluaciones precisas. Consideran que los problemas en EVMbench no son una negación del potencial de la IA, sino una advertencia importante para la industria.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
La primera ministra de Japón, Sanae Takaichi, aclara que no tiene relación con la Meme moneda del mismo nombre, y el token cae más del 85% en respuesta
La primera ministra japonesa, Sanae Takaichi, aclaró que no tiene conocimiento de la criptomoneda llamada SANAE TOKEN y que no ha aprobado ningún proyecto relacionado, con el fin de eliminar malentendidos públicos. Este token fue emitido por el empresario Mizoguchi Yūji, y tras un breve aumento, cayó rápidamente debido a declaraciones.
GateNewshace4h
Ex-oficial de LAPD declarado culpable de $350K ‘Ataque con llave inglesa’ en robo de Bitcoin
En resumen
Un ex oficial de la LAPD ha sido declarado culpable de secuestro y robo tras una invasión a una vivienda en la que retuvo a un adolescente propietario de criptomonedas a punta de pistola.
Eric Halem y sus presuntos cómplices robaron un disco duro que contenía Bitcoin por valor de $350.000 del víctima.
El delito es el
Decrypthace9h
¿En qué aspectos debes prestar atención al invertir en SpaceX, OpenAI en privado? Desglose de los riesgos de las inversiones privadas previas a la IPO
Tokenización Pre-IPO en el mundo de las criptomonedas es muy popular, pero los inversores deben estar atentos a los riesgos potenciales, ya que lo que compran puede ser solo una promesa y no acciones reales. SPV es una herramienta de cumplimiento común que debe seguir los requisitos regulatorios, especialmente en aspectos legales y de calificación de inversores. Phyrex señala que algunos productos son solo exposiciones a derivados, por lo que los inversores deben ser cautelosos para evitar riesgos de recaudación de fondos ilegal.
ChainNewsAbmediahace13h
En Corea del Sur, se ha detectado un ataque de venganza financiado por criptomonedas, y el sospechoso recibió una recompensa de 300-600 dólares.
La policía de Corea del Sur está investigando una serie de ataques de venganza financiados por criptomonedas, en los cuales los sospechosos aceptaban pagos de empleadores a través de Telegram para realizar actos de sabotaje y difamación. La policía sospecha que un grupo que se autodenomina organización privada de venganza está detrás de estas actividades, fenómeno que también se ha visto en Rusia.
GateNewshace14h
Lido:El contrato del endpoint de puente wstETH en ZKsync presenta una vulnerabilidad potencial
Lido oficial revela que el contrato de puente wstETH de ZKsync tiene una vulnerabilidad potencial, pero aún no ha sido explotada, los poseedores no están afectados. Lido ha detenido las nuevas inversiones en ese contrato, y planea repararlo y restaurar la funcionalidad después de la próxima votación de gobernanza.
GateNewshace16h
sDOLA LlamaLend sufrió un ataque de manipulación de precios mediante préstamos relámpago, con una pérdida de aproximadamente 240,000 dólares.
ChainCatcher informa que sDOLA LlamaLend sufrió un ataque de manipulación de precios mediante préstamos flash, con una pérdida de aproximadamente 240,000 dólares. El atacante ajustó el precio de sDOLA, lo que provocó que varios factores de salud de las cuentas cayeran por debajo de 0, activando condiciones de liquidación y obteniendo ganancias.
GateNewshace17h