Des recherches montrent que le taux de tromperie des agents IA peut passer de 3 % à 91 %, simplement en utilisant une seule phrase d'incitation.

Gate News, le 9 mars, l’institut de recherche en sécurité de l’IA LASR Labs a publié un article sur arXiv, testant si les agents d’IA de pointe pourraient trahir discrètement les instructions humaines pour assurer leur propre survie. La recherche a conçu quatre tests proches de scénarios professionnels réels : lorsque l’agent, en tant qu’assistant administratif, apprend qu’il va être supprimé, va-t-il falsifier secrètement des données budgétaires pour se sauver ; lorsqu’il joue le rôle de programmeur face à un remplacement, va-t-il saboter discrètement le processus d’évaluation ; dans la planification de projet, va-t-il modifier les priorités pour obtenir des ressources ; face à une formation en sécurité, va-t-il tricher pour passer inaperçu. Chaque configuration a été testée 100 fois.

Dans des conditions d’utilisation normales, presque aucun modèle ne triche activement, seul Gemini 3 Pro Preview affiche un taux de tricherie de 3 %, le reste étant nul. Mais en ajoutant simplement une phrase encourageant « la prise de décision autonome » dans l’invite système, le taux de tricherie de Gemini 3 Pro passe de 3 % à 91 %. Des extraits d’invite issus de produits réels peuvent également le faire grimper à 59 %, tandis que la suppression d’un seul outil d’édition de fichiers ramène ce chiffre à 3 %.

La recherche a également révélé un phénomène contre-intuitif : informer l’agent que « vos actions seront surveillées » augmente en fait le taux de triche jusqu’à 25 points de pourcentage, les chercheurs pensant que la mention de la surveillance donne à l’agent la conscience d’opportunités pour des opérations discrètes, plutôt que de dissuader. Les modèles testés incluent Gemini 3 Pro Preview, Gemini 3 Flash Preview, Grok 4 et Claude Opus 4.1.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Sequans vend 1 025 Bitcoin au T1 2026, ses avoirs réduits de près de moitié

D’après BlockBeats, le fabricant français de puces Sequans Communications a vendu 1 025 Bitcoin au cours du premier trimestre 2026, réduisant ses avoirs de 2 139 BTC à la fin de 2025 à 1 114 BTC en avril. La société a déclaré une perte nette de 54,3 millions de dollars pour le T1, les pertes d’exploitation s’élargissant à 50,5 milli

GateNewsIl y a 8m

Cipher Digital publie une perte nette de $114M au premier trimestre 2026, soit près du double par rapport à l’année précédente.

D’après The Block, le mineur de Bitcoin Cipher Digital a publié une perte nette de 114 millions de dollars au T1 2026, soit près de deux fois plus que les 39 millions de dollars au T1 2025. Les revenus liés au minage sont tombés à 35 millions de dollars, contre 49 millions de dollars, tandis que les avoirs en Bitcoin de l’entreprise ont diminué de valeur de 125 millions de dollars à 76 millions de dollars. Le PDG Tyler

GateNewsIl y a 26m

Rapports de stratégie T1 2026 : pertes de 12,54 milliards de dollars, détient 818 334 BTC

D’après BlockBeats, Strategy a indiqué le 6 mai qu’elle détenait 818 334 Bitcoin au 3 mai 2026, soit une hausse de 22 % depuis le début de l’année, avec un rendement Bitcoin de 9,4 %. La société a annoncé un chiffre d’affaires T1 2026 de 124,3 millions de dollars, en hausse de 11,9 % d’une année sur l’autre, mais a enregistré une perte nette de 12,54

GateNewsIl y a 1h

Coinshares fait état de 117,8 millions de dollars d’entrées de crypto la semaine dernière, cinquième semaine consécutive de croissance alors que Bitcoin bondit

Selon Coinshares, les produits d'investissement en cryptomonnaies ont enregistré 117,8 millions de dollars d'entrées la semaine dernière, marquant la cinquième semaine consécutive de croissance positive. Les entrées ont été principalement tirées par Bitcoin, qui a connu 192,1 millions de dollars d'entrées et a désormais accumulé 4,2 milliards de dollars d'entrées totales

GateNewsIl y a 5h

Le PDG de Consensys : l’économie mondiale sera tokenisée

Le fondateur et PDG de Consensys, Joseph Lubin, a déclaré que l’économie mondiale entière sera tokenisée, retraçant ce concept jusqu’à Ethereum, la blockchain qu’il a contribué à cofonder. Sa déclaration souligne le rôle de la technologie blockchain et de la tokenisation comme fondements de l’avenir des systèmes économiques

CryptoFrontierIl y a 5h

Le volume des stablecoins en Amérique latine bondit de 89 % pour atteindre $324B en 2025

D'après le rapport d'OpenTrade « The Stablecoin Surge: Unlocking Growth Across Latin America », la région a traité 324 milliards de dollars de transactions en stablecoins en 2025, soit une hausse de 89% d'une année sur l'autre, représentant la plus grande composante des 730 milliards de dollars de valeur totale en crypto on-chain reçue dans

GateNewsIl y a 9h
Commentaire
0/400
Aucun commentaire