微软 Build 发布 7 款 AI 模型,Token 用量较竞品少 60%

微軟Build AI模型

微软(Microsoft)于 6 月 Build 大会上宣布推出 7 款新 AI 模型,涵盖推理、代码、图片、转录和语音领域。在 4 项核心编程基准测试中,MAI-Code-1-Flash 全数优于 Claude Haiku 4.5,并在 SWE-Bench Verified 上 Token 使用量减少最高达 60%。

7 款模型清单:五大领域全面覆盖

微软 Build 大会已公开完整名称的 6 款模型为:MAI Thinking-1(推理)、MAI Code-1-Flash(代码)、MAI Image-2.5(图片)、MAI Image-2.5-Flash(图片精简版)、MAI Transcribe-1.5(转录)及一款语音模型;第 7 款模型的完整名称于现有报道中尚未完整披露。微软声明旗舰推理模型 MAI-Thinking-1 在 STEM 推理和编码任务上与同类模型具有竞争力,未提供具体基准数据。

MAI-Code-1-Flash vs Claude Haiku 4.5:4 项基准测试数据

MAI-Code-1-Flash 在以下 4 项基准测试中通过率均高于 Claude Haiku 4.5,同时使用更少 Token:

SWE-Bench Pro:MAI-Code-1-Flash 51.2% vs Claude Haiku 4.5 35.2%,领先 16 分

SWE-Bench Verified:解决复杂问题的 Token 使用量减少最高达 60%

IF Bench(精确指令追踪):MAI-Code-1-Flash 领先 28.9 分

Advanced IF:MAI-Code-1-Flash 领先 14.5 分

微软官方文件指出,MAI-Code-1-Flash 在 Einstellung 陷阱等核心对抗性类别中的准确率仍低于 50%,属已识别的现有改进空间。

MAI-Code-1-Flash 目前可用范围:个人用户无需额外设置

MAI-Code-1-Flash 现已在 VS Code 的 GitHub Copilot 个人用户版本中推出,可通过模型选择器直接使用,或由 Copilot 自动选择器自动路由。模型采用自适应解长控制,对简单请求保持简洁,对复杂任务投入更多推理资源。MAI-Code-1-Flash 的企业版及其他用户群的部署时程目前尚未公布。

常见问题

微软 Build 2026 发布的 7 款新模型分别是什么?

已公开完整名称的包括 MAI Thinking-1、MAI Code-1-Flash、MAI Image-2.5、MAI Image-2.5-Flash、MAI Transcribe-1.5 及一款语音相关模型,共 6 款;第 7 款模型的完整名称于现有官方报道中尚未完整披露。

MAI-Code-1-Flash 的 60% Token 减少如何实现?

微软声明该模型采用自适应解长控制训练,根据任务复杂程度自动调整反应深度。微软在 SWE-Bench Verified 测试中的结果显示,解决复杂问题时的 Token 使用量最高可减少 60%。

MAI-Code-1-Flash 目前对哪些用户开放,企业版时程为何?

截至 2026 年 6 月,MAI-Code-1-Flash 已对 VS Code GitHub Copilot 个人用户开放,无需额外设置。微软尚未公布企业版或其他用户群的部署时程。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论