Anthropic Claude занимает первое место в новом тесте на устойчивость к пропаганде для LLM

2026-06-04 20:57:18

Согласно Эстонскому языковому институту, недавно организация, поддерживаемая государством, опубликовала новый бенчмарк «Сопротивление пропаганде», в котором ранжируются десятки больших языковых моделей по тому, насколько хорошо они способны избегать занятости позиций по российским стратегическим нарративам. Модели Anthropic Claude показали лучшие результаты среди моделей уровня frontier: Claude Opus 4.7 набрал 94,9 из 100 и получил оценку «Примерно» на 77 процентах тестовых вопросов. Бенчмарк оценивал ответы LLM в 14 категориях российских операций влияния, включая темы от статуса Крыма до истории НАТО.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

2ч назад

Президент Anthropic называет высокие затраты на обучение ИИ ключевым фактором при рассмотрении IPO

2ч назад

Anthropic развернула модель ИИ Mythos в Национальном агентстве безопасности США (NSA) для киберопераций, задействованы 6 инженеров

5ч назад

Предпросмотр Mythos от Anthropic превосходит людей в 64% исследовательских решений, что выше 22% в 2024 году

16ч назад

67% заблокированных аккаунтов Anthropic использовали ИИ, чтобы подготовиться к кибератакам

17ч назад

Индийские компании в сфере кибербезопасности и финансов получают ранний доступ к модели Anthropic Claude Mythos

Детальный анализ