Google DeepMind выпустила ИИ со-математика — многoагентного исследовательского помощника по математике, достигнув 47,9% точности в бенчмарке FrontierMath Tier 4, превзойдя предыдущий рекорд GPT-5.5 Pro (39,6%) от 9 мая. Система решила 23 из 48 задач, включая 3, которые до этого не смогли решить ни одна из предыдущих моделей. Построенная на Gemini 3.1 Pro архитектура использует иерархический дизайн: агент-координатор проекта распределяет задачи между субагентами, отвечающими за извлечение литературы, кодирование и рассуждения; перед подачей несколько агентов-ревьюеров валидируют доказательства.
Epoch AI провела слепое тестирование, не позволяя команде DeepMind видеть задачи, при этом на каждый вопрос отводилось по 48 часов вычислений. В реальном применении математик Марк Лакенби использовал систему, чтобы разрешить открытую гипотезу из Kourovka Notebook, демонстрируя ее практическую исследовательскую ценность. Сейчас система доступна ограниченному числу математиков в рамках бета-тестирования.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Акции Cloudflare падают на 23,62% 8 мая после публикации отчетности за 1-й квартал и объявления о сокращении штата на 1 100 человек
Акции Cloudflare упали на 23,62% 8 мая до $196,13 за акцию после публикации компанией отчёта о финансовых результатах за первый квартал и объявления о примерно 1 100 сокращениях. Хотя выручка за Q1 в размере $640 миллионов превысила ожидания, показав рост на 34% в годовом выражении, прогноз по выручке на второй квартал $664–$665 миллионов не дотянул до предыдущего ожидания рынка в $666 миллионов. Сокращения, составляющие около 20% штата, являются частью перехода компании к модели работы «AI-agen
GateNews26м назад
Helsing планирует привлечь финансирование при оценке в 18 миллиардов долларов
Согласно Financial Times, Helsing, немецкий стартап по беспилотникам с ИИ, планирует привлечь новое финансирование при оценке примерно в $18 миллиарда.
GateNews1ч назад
Система вознаграждений OpenAI непреднамеренно оценивает цепочки рассуждений на 6 моделях, включая GPT-5.4
Команда по согласованию (alignment) OpenAI недавно обнаружила критическую ошибку в обучении, затрагивающую 6 крупных языковых моделей, включая GPT-5.4. Ошибка заключалась в том, что механизм вознаграждения случайно присваивал баллы «цепочкам мышления» — внутреннему процессу рассуждений перед формированием ответов. На GPT-5.5 это не повлияло. Инцидент нарушает фундаментальный принцип безопасности ИИ: цепочки мышления нельзя оценивать, поскольку это может побудить модели выдумывать рассуждения для
GateNews2ч назад
Alibaba не вела переговоры с DeepSeek, разъяснили рыночные источники 9 мая
По данным рыночных источников, о которых сообщило Caixin Daily 9 мая, Alibaba не вела переговоры с DeepSeek о финансировании. Это уточнение последовало за более ранними сообщениями СМИ, которые предполагали, что переговоры между двумя компаниями сорвались. В апреле DeepSeek запустила заметный раунд привлечения средств, вызвавший интерес со стороны как Tencent, так и Alibaba.
GateNews2ч назад
OpenAI выпустила инструмент миграции Codex для импорта конфигураций от конкурирующих ИИ-ассистентов
По данным OneMillionAI (Beating), OpenAI выпустила инструмент миграции в Codex, который позволяет пользователям импортировать конфигурации и данные из других ИИ-сервисов для написания кода, включая Claude Code. Инструмент, анонсированный через официальный аккаунт OpenAI в Twitter, автоматически переносит системные промпты, пользовательские навыки, 30-дневную историю чатов, конфигурации MCP-сервера, хуки и настройки под-агентов. OpenAI отметила, что инструмент миграции в большинстве случаев обраб
GateNews3ч назад
ByteDance увеличивает расходы на AI-инфраструктуру на 25% до 200 миллиардов юаней 9 мая
По сообщениям СМИ ByteDance увеличила запланированные расходы на ИИ-инфраструктуру на 25% — до 200 миллиардов юаней в 2026 году, поскольку компания ускоряет развертывание искусственного интеллекта на фоне роста поставок чипов памяти
GateNews4ч назад