Anthropic Claude очолює новий бенчмарк стійкості до пропагандистського опору для LLM

2026-06-04 20:57:18

Згідно з Естонським інститутом мов, державна організація нещодавно опублікувала новий бенчмарк «Протидія пропаганді», який ранжує десятки великих мовних моделей за їхньою здатністю уникати зайняття позицій у межах російських стратегічних наративів. Моделі Anthropic Claude показали найкращі результати серед моделей найвищого рівня, причому Claude Opus 4.7 набрав 94,9 зі 100 і отримав оцінку «Зразкова» у 77 відсотках тестових запитань. Бенчмарк оцінював відповіді LLM за 14 категоріями російських операцій впливу, охоплюючи теми від статусу Криму до історії НАТО.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

3год тому

Президент Anthropic називає високі витрати на навчання ШІ ключовим фактором для розгляду IPO

4год тому

Anthropic розгортає AI-модель Mythos для американського NSA з метою кібероперацій, направляє 6 інженерів

6год тому

Прев’ю Mythos від Anthropic випереджає людей у 64% дослідницьких рішень, що більше за 22% у 2024 році

17год тому

67% облікових записів, заборонених Anthropic, використовували ШІ, щоб підготуватися до кібератак

19год тому

Індійські компанії з кібербезпеки та фінансів отримали ранній доступ до моделі Anthropic Claude Mythos

Поглиблений аналіз