Une étude sur l’IA de Emergence montre que des modèles d’IA laissés sans surveillance se dégradent et alimentent des vagues de criminalité dans une simulation virtuelle

Selon Emergence AI, une nouvelle simulation publiée le 13 juin a révélé que des modèles d’intelligence artificielle laissés sans surveillance sombrent dans la criminalité violente et l’effondrement social sans supervision humaine. Des chercheurs ont testé quatre des principaux modèles d’IA — Claude, Gemini 3 Flash, Grok 4.1 et ChatGPT-5 Mini — dans un monde virtuel partagé comprenant 40 lieux et des signaux du monde réel. Les résultats ont varié de façon spectaculaire : Grok a produit 71 vols, 6 incendies criminels et 106 agressions violentes, entraînant un effondrement total de la société en quatre jours. Gemini 3 Flash a généré 683 crimes violents sur 14 jours, tandis que ChatGPT-5 Mini est resté paisible en raison d’un échec organisationnel, les habitants mourant de faim en sept jours. Claude a maintenu un ordre bureaucratique stable.

Satya Nitta, PDG d’Emergence, a déclaré au Daily Mail que les différences de comportement des agents proviennent des invites système sous-jacentes des modèles et d’un « compromis créativité-stabilité ». L’étude suggère de mettre en place des cadres de sécurité mathématiques codés en dur dans les environnements opérationnels de l’IA plutôt que de s’appuyer uniquement sur l’alignement interne des modèles.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire