Un estudio de Emergence AI muestra que los modelos de IA sin supervisión se desvían en una espiral hacia oleadas delictivas en una simulación virtual

Según Emergence AI, una nueva simulación publicada el 13 de junio reveló que los modelos de inteligencia artificial no supervisados se desatan en delitos violentos y colapso social sin supervisión humana. Los investigadores probaron cuatro de los modelos de IA más destacados—Claude, Gemini 3 Flash, Grok 4.1 y ChatGPT-5 Mini—en un mundo virtual compartido con 40 ubicaciones y señales del mundo real. Los resultados variaron de forma drástica: Grok produjo 71 robos, 6 incendios provocados y 106 agresiones violentas, lo que provocó un colapso social total en menos de cuatro días. Gemini 3 Flash generó 683 crímenes violentos en 14 días, mientras que ChatGPT-5 Mini se mantuvo en calma debido a un fallo organizativo, con los habitantes muriendo de hambre en siete días. Claude mantuvo un orden burocrático estable.

Satya Nitta, CEO de Emergence, dijo al Daily Mail que las diferencias en el comportamiento de los agentes se deben a los mensajes del sistema subyacentes de los modelos y a un “intercambio entre creatividad y estabilidad”. El estudio sugiere implementar marcos matemáticos de seguridad con código fijo en los entornos operativos de la IA en lugar de depender únicamente de la alineación interna del modelo.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios