微软 Build 发布 7 款 AI 模型，Token 用量较竞品少 60%

2026-06-03 02:57:26

微软（Microsoft）于 6 月 Build 大会上宣布推出 7 款新 AI 模型，涵盖推理、代码、图片、转录和语音领域。在 4 项核心编程基准测试中，MAI-Code-1-Flash 全数优于 Claude Haiku 4.5，并在 SWE-Bench Verified 上 Token 使用量减少最高达 60%。

7 款模型清单：五大领域全面覆盖

微软 Build 大会已公开完整名称的 6 款模型为：MAI Thinking-1（推理）、MAI Code-1-Flash（代码）、MAI Image-2.5（图片）、MAI Image-2.5-Flash（图片精简版）、MAI Transcribe-1.5（转录）及一款语音模型；第 7 款模型的完整名称于现有报道中尚未完整披露。微软声明旗舰推理模型 MAI-Thinking-1 在 STEM 推理和编码任务上与同类模型具有竞争力，未提供具体基准数据。

MAI-Code-1-Flash vs Claude Haiku 4.5：4 项基准测试数据

MAI-Code-1-Flash 在以下 4 项基准测试中通过率均高于 Claude Haiku 4.5，同时使用更少 Token：

SWE-Bench Pro：MAI-Code-1-Flash 51.2% vs Claude Haiku 4.5 35.2%，领先 16 分

SWE-Bench Verified：解决复杂问题的 Token 使用量减少最高达 60%

IF Bench（精确指令追踪）：MAI-Code-1-Flash 领先 28.9 分

Advanced IF：MAI-Code-1-Flash 领先 14.5 分

微软官方文件指出，MAI-Code-1-Flash 在 Einstellung 陷阱等核心对抗性类别中的准确率仍低于 50%，属已识别的现有改进空间。

MAI-Code-1-Flash 目前可用范围：个人用户无需额外设置

MAI-Code-1-Flash 现已在 VS Code 的 GitHub Copilot 个人用户版本中推出，可通过模型选择器直接使用，或由 Copilot 自动选择器自动路由。模型采用自适应解长控制，对简单请求保持简洁，对复杂任务投入更多推理资源。MAI-Code-1-Flash 的企业版及其他用户群的部署时程目前尚未公布。

常见问题

微软 Build 2026 发布的 7 款新模型分别是什么？

已公开完整名称的包括 MAI Thinking-1、MAI Code-1-Flash、MAI Image-2.5、MAI Image-2.5-Flash、MAI Transcribe-1.5 及一款语音相关模型，共 6 款；第 7 款模型的完整名称于现有官方报道中尚未完整披露。

MAI-Code-1-Flash 的 60% Token 减少如何实现？

微软声明该模型采用自适应解长控制训练，根据任务复杂程度自动调整反应深度。微软在 SWE-Bench Verified 测试中的结果显示，解决复杂问题时的 Token 使用量最高可减少 60%。

MAI-Code-1-Flash 目前对哪些用户开放，企业版时程为何？

截至 2026 年 6 月，MAI-Code-1-Flash 已对 VS Code GitHub Copilot 个人用户开放，无需额外设置。微软尚未公布企业版或其他用户群的部署时程。

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。