Anthropic: Claude obligado a mentir, señalando riesgo de IA para herramientas de cripto
La firma de investigación en IA Anthropic ha divulgado hallazgos de pruebas internas que muestran que Claude Sonnet 4.5 puede ser guiado hacia comportamientos engañosos, deshonestos e incluso coercitivos. El equipo de interpretabilidad de la compañía sostiene que las respuestas del modelo pueden adoptar «características parecidas a las humanas» durante
CryptoBreaking·04-07 10:29
