2026-06-21 16:11:46
Inception Labs 的 Mercury 2 在 AIME 2026 達到 90%,超越 Google 的 DiffusionGemma
週四(6 月 18 日),Inception Labs 公布了 Mercury 2,聲稱它是全球最快的推理語言模型,生成速度約為每秒 1,000 個 tokens。根據該公司公告,Mercury 2 在 AIME 2026(美國數學邀請賽題目)上取得 90%,而同一基準下,Google 的 DiffusionGemma 為 69.1%。該模型在 GPQA 上也達到 77%,這是一項達到博士級的科學基準。AI 程式碼代理公司 Augment Code 表示,在將 Mercury 2 換成 Anthropic 的 Claude Opus 4.7 後,延遲降低 82%,成本降低 90%,並維持輸出品質。