2026-06-21 16:11:46
Inception Labs 的 Mercury 2 在 AIME 2026 上达成 90%,胜过 Google 的 DiffusionGemma
在周四(6 月 18 日),Inception Labs 揭晓了 Mercury 2,称其为世界最快的推理语言模型,生成速度约为每秒 1,000 个 token。根据公司的公告,Mercury 2 在 AIME 2026(美国数学邀请赛)上取得了 90%,而谷歌的 DiffusionGemma 在同一基准上为 69.1%。该模型在 GPQA 上也取得了 77%,该基准为博士级科学测试。AI 编程代理公司 Augment Code 表示,在将 Mercury 2 替换为 Anthropic 的 Claude Opus 4.7 后,延迟降低了 82%,成本降低了 90%,并维持了输出质量。