DERNIÈRE HEURE : une nouvelle étude d'Anthropic soutient que Claude ne ressemble pas à un humain, mais qu'il possède des représentations internes d'émotions telles que le bonheur, la peur et le désespoir qui influencent son comportement.


Cette découverte soulève des questions clés sur la sécurité, l'alignement et le fonctionnement réel des modèles d'IA.
Anthropic a analysé Claude Sonnet 4.5 et a détecté des schémas internes associés à 171 concepts émotionnels.
Voir l'original
post-image
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler