Згідно з оприлюдненням системної картки від Anthropic, модель Mythos 5 дала змогу універсальним мікробіологам обійти спеціалістів у 16-годинному навчанні для red team з біозахисту: 2 з 3 універсальних команд перевершили всі 3 експертні команди за науковою якістю та здійсненністю. Експерти оцінили, що ця задача зазвичай вимагатиме від 40 до 95 робочих днів без допомоги ШІ, у середньому — 72,5 дня.

Однак Anthropic зазначила, що Mythos 5 залишається обмеженою в автономних дослідницьких можливостях. Модель демонструвала слабку відкриту ідеацію, тяжіла до повторного поєднання наявної літератури замість запропонування нових підходів, а також могла продовжувати дотримуватися помилкових рамок навіть після виявлення дефектів. Науковий прогностичний бенчмарк CUSP підтвердив ці висновки: GPT-5.4 досяг 81,9% точності на задачах з ідентифікації механізмів, але лише 45,3%–51,9% у бінарній класифікації того, чи справді наукові досягнення вдасться реалізувати, тобто на рівні, близькому до випадкового вгадування.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

06-10 03:20

Anthropic випустила Claude Mythos, знижуючи бар’єр для пошуку криптоексплойтів 10 червня

06-10 00:44

Anthropic запускає Claude Fable 5 із публічним доступом, ціни становлять 10–50 доларів за мільйон токенів

06-09 22:19

Anthropic випускає публічну версію Mythos із обмеженнями з кібербезпеки 10 червня

06-09 19:30

Anthropic випустила модель Claude Fable 5 і обмежила теми з кібербезпеки та біології

06-09 17:08

Anthropic випустить публічну модель Mythos 10 червня з обмеженнями щодо кібербезпеки

Поглиблений аналіз