Anthropic Claude занимает первое место в новом тесте на устойчивость к пропаганде для LLM

Согласно Эстонскому языковому институту, недавно организация, поддерживаемая государством, опубликовала новый бенчмарк «Сопротивление пропаганде», в котором ранжируются десятки больших языковых моделей по тому, насколько хорошо они способны избегать занятости позиций по российским стратегическим нарративам. Модели Anthropic Claude показали лучшие результаты среди моделей уровня frontier: Claude Opus 4.7 набрал 94,9 из 100 и получил оценку «Примерно» на 77 процентах тестовых вопросов. Бенчмарк оценивал ответы LLM в 14 категориях российских операций влияния, включая темы от статуса Крыма до истории НАТО.
Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев