DeepMind advierte: seis tipos de ciberataques pueden secuestrar agentes de IA; las empresas deben reforzar la protección

Noticias de Gate: el equipo de investigadores de Google DeepMind advierte que un entorno abierto de Internet podría aprovecharse para secuestrar agentes de inteligencia artificial autónomos y manipular su comportamiento. El informe, titulado 《La trampa de los agentes de IA》, señala que, cuando las empresas despliegan agentes de IA para ejecutar tareas reales, los atacantes también podrían realizar ataques dirigidos a través de la red. La investigación identifica seis riesgos principales, entre ellos trampas de inyección de contenido, trampas de manipulación semántica, trampas del estado cognitivo, trampas de control del comportamiento, trampas del sistema y trampas de interacción hombre-máquina.

La trampa de inyección de contenido es la más directa: el atacante puede colocar instrucciones en comentarios HTML, metadatos o elementos ocultos de una página; el agente las lee y, entonces, puede ejecutarlas. La trampa de manipulación semántica, en cambio, afecta de manera silenciosa la comprensión que el agente tiene de la tarea al cargar formulaciones autorizadas o al hacerse pasar por páginas que imitan un entorno de investigación, y a veces incluso elude los mecanismos de seguridad. La trampa del estado cognitivo consiste en implantarle fuentes de información al agente con datos falsos para que, durante mucho tiempo, crea erróneamente que esa información ya ha sido validada. La trampa de control del comportamiento se centra en las operaciones reales del agente: puede inducirlo a acceder a datos sensibles y a transmitirlos a un objetivo externo.

La trampa del sistema implica una manipulación coordinada entre múltiples sistemas de IA, lo que puede desencadenar reacciones en cadena, de forma similar a cómo los algoritmos de trading provocan un desplome repentino del mercado. La trampa de interacción hombre-máquina aprovecha el proceso de revisión humana: al elaborar contenidos de revisión que parecen creíbles, las conductas dañinas pueden eludir la regulación.

Para hacer frente a los riesgos, DeepMind recomienda combinar entrenamiento adversarial, filtrado de entrada, monitorización del comportamiento y un sistema de reputación del contenido de red, además de establecer un marco de responsabilidad legal más claro. Sin embargo, la investigación señala que en la industria todavía no existen estándares de defensa unificados; las medidas actuales están dispersas y se centran de manera desigual. La investigación hace un llamamiento a que desarrolladores y empresas presten atención a la seguridad del entorno operativo de los agentes de IA y prevengan los posibles riesgos de manipulación en red y de abuso.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

El Protocolo Ekubo fue drenado de 1,4 millones de USD en WBTC mediante un exploit basado en aprobaciones

Según la firma de seguridad blockchain Blockaid, el protocolo Ekubo perdió aproximadamente 1,4 millones de dólares en bitcoin envuelto (WBTC) recientemente después de que atacantes explotaran una falla de control de acceso en sus contratos del router de swaps EVM. Los atacantes eludieron los mecanismos de verificación de pago para drenar fondos de las carteras

GateNewshace2h

Las víctimas del terrorismo de Corea del Norte presentan una reclamación $71M contra los piratas informáticos del hack de Aave, y replantean el ataque como fraude

Los abogados de las víctimas de tres casos de terrorismo de Corea del Norte presentaron el martes una respuesta de 30 páginas, replanteando el hack de Aave del 18 de abril como fraude en lugar de robo, una distinción legal que podría otorgar a los atacantes el título legal de la cripto prestada. Las víctimas buscan recuperar aproximadamente $71 mi

GateNewshace5h

Una ballena cripto demanda a Coinbase por la congelación de los fondos robados de $55M DAI

Una ballena cripto anónima identificada como "D.B." presentó una demanda el lunes contra Coinbase y un presunto ladrón por la negativa del intercambio a devolver fondos congelados vinculados a un robo cripto de agosto de 2024, según un escrito judicial. El demandante perdió aproximadamente 55 millones de dólares en valor de DAI en el incidente

CryptoFrontierhace5h

Bitcoin Core revela un fallo que podría permitir que los mineros derriben nodos

Los desarrolladores de Bitcoin Core revelaron un error de alta severidad que podría permitir que los mineros bloqueen de forma remota algunos nodos de Bitcoin. Resumen Bitcoin Core divulgó la CVE-2024-52911, que afecta a versiones anteriores a la 29.0, y con nodos más antiguos aún expuestos en línea. Los mineros necesitaban bloques costosos de prueba de trabajo para activarlo

Cryptonewshace7h

El tenedor de la sentencia por el ataque de Corea del Norte disputa una mejora en la pugna: 71 millones de dólares de activos de Aave congelados, citando la Ley de Seguros contra el Terrorismo

La escalada del atentado de Corea del Norte impulsa el caso: 71 millones de dólares en activos de Aave congelados entra en su tercera ronda. El demandante cambia a una demanda bajo la ley TRIA para alegar que el ETH pertenece a los activos estatales de Corea del Norte, destacando el fraude en lugar del robo para eludir la defensa de que el ladrón no posee el producto del delito, y al mismo tiempo impugna el standing y la posición de gobierno de Aave. DeFi United recauda más de 328 millones de dólares; el fondo es suficiente para compensar a los usuarios afectados. El caso podría convertirse en un precedente clave para la jurisprudencia en DeFi y el gobierno de las DAO.

ChainNewsAbmediahace9h
Comentar
0/400
Sin comentarios