Google DeepMind випустила AI співматематика — багатoагентного помічника з математичних досліджень, який досяг 47,9% точності на бенчмарку FrontierMath Tier 4, перевершивши попередній рекорд GPT-5.5 Pro: 39,6% (станом на 9 травня). Система розв’язала 23 із 48 задач, зокрема 3, які не змогли розв’язати всі попередні моделі. Побудована на Gemini 3.1 Pro, архітектура використовує ієрархічну конструкцію: агент-координатор проєкту розподіляє завдання між підагентами, що займаються пошуком літератури, кодуванням і міркуванням, а кілька агентів-рецензентів перевіряють докази перед поданням.

Epoch AI провела сліпе тестування, не даючи команді DeepMind бачити задачі, при цьому на кожне питання відводилося 48 годин обчислень. У реальному застосуванні математик Марк Лакенбі використав систему, щоб розв’язати відкриту гіпотезу з Kourovka Notebook, продемонструвавши її практичну цінність для досліджень. Наразі система доступна обмеженій кількості математиків у бета-тестуванні.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-09 09:54

Система винагород OpenAI ненавмисно оцінює ланцюги міркувань на 6 моделях, зокрема GPT-5.4

05-09 05:53

Google вимагатиме використання ШІ під час співбесіди з кодування, а запуск найму з підтримкою Gemini відбудеться пізніше цього року

05-09 05:53

China Mobile запускає платформу моделей ШІ з 300+ інтеграціями, знижує витрати на токени на 30%

05-08 14:41

SwarmBase інтегрує агент AIDEN від IQ AI 7 травня

05-08 06:52

GoldFinger і 4AI оголошують стратегічне партнерство, щоб поєднати токенізоване золото з децентралізованим ШІ

Поглиблений аналіз