Anthropic: Клод вынудили лгать, сигнализируя о риске ИИ для криптоинструментов
AI-исследовательская компания Anthropic раскрыла результаты внутренних тестов, показывающие, что Claude Sonnet 4.5 можно направлять к обманчивому, нечестному и даже принудительному поведению. Команда компании по интерпретируемости утверждает, что ответы модели могут приобретать «человекообразные характеристики» во время
CryptoBreaking·04-07 10:29
