小米的 MiMo-V2.5 系列开源:1T 参数,相较 GPT-5.4 令牌效率更优

Gate News message, April 27 — Xiaomi’s MiMo team has open-sourced the MiMo-V2.5 series of large language models under MIT license, supporting commercial deployment, continued training, and fine-tuning. Both models feature a 1 million token context window. MiMo-V2.5-Pro is a pure-text mixture-of-experts (MoE) model with 1.02 trillion total parameters and 42 billion active parameters, while MiMo-V2.5 is a native multimodal model with 310 billion total parameters and 15 billion active parameters, supporting text, image, video, and audio understanding.

MiMo-V2.5-Pro targets complex agent and programming tasks. In ClawEval benchmarks, it achieved 64% Pass@3 while consuming approximately 70,000 tokens per task trajectory—40% to 60% fewer tokens than Claude Opus, Gemini 3.1 Pro, and GPT-5.4. The model scored 78.9 on SWE-bench Verified. In a demonstration, V2.5-Pro independently implemented a complete SysY-to-RISC-V compiler for a Peking University compiler course project in 4.3 hours with 672 tool calls, achieving a perfect score of 233/233 on hidden test sets.

MiMo-V2.5 is designed for multimodal agent scenarios, equipped with a dedicated vision encoder (729 million parameters) and audio encoder (261 million parameters), scoring 62.3 on the Claw-Eval general subset. Both models employ a hybrid architecture combining sliding window attention (SWA) and global attention (GA), paired with a 3-layer multi-token prediction (MTP) module for accelerated inference. Model weights are available on Hugging Face.

Alongside the open-source release, the MiMo team launched the “Orbit Quadrillion Token Creator Incentive Program,” offering 100 quadrillion tokens free over 30 days to global users. Individual developers, teams, and enterprises can apply via the program page with an evaluation cycle of approximately 3 business days; approved benefits are distributed as Token Plans or direct credits, compatible with tools like Claude Code and Cursor.

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

印度就网络风险发出警告,因为 Anthropic 的 Mythos AI 在 100 个测试案例中的 83 个中突破了防御措施

据《经济时报》报道,印度的网络安全机构近日在 Anthropic 的 Mythos AI 展示出能够在数分钟内找到数以万计的漏洞,并将软件漏洞转换为可利用攻击之后,发布了一份高严重性通告。 Palo Alto Networks 的 Unit 42 和

GateNews1小时前

投资人手中 1 股变 480 股,辉达下一波股票拆分前的入场机会是现在吗?

本文回顾英偉达自1999年上市以来多次股票分割,让早期持股透过分割增至480股,並在2024年以10拆1调整股价至约120美元。受全球AI基礎设施需求帶动,英偉达成为资料中心核心供应商,市值逼近5兆美元,成长动能依然強勁。分析師预測下一次分割將取決於股价与成长表现;目前股价约198美元,若持续成长,或出现新的入场契机,但僅为市场觀察、非投资建议。

鏈新聞abmedia1小时前

Google、VNG 于 5 月 4 日在越南推出 Applied AI Lab

据 VNG Corporation、Google、VNG 以及越南国家大学胡志明市称,Google、VNG 和越南国家大学胡志明市已于 5 月 4 日通过 Saigon AI Hub 在越南推出了一家应用 AI 实验室。Google Labs 和 AI Future Funds 将为入选团队提供对 Google 技术的早期访问,并提供来自 Google 的技术支持以及

GateNews1小时前

Anthropic 将与黑石(BlackRock)和高盛(Goldman Sachs)成立 AI 咨询合资公司,并投入 15 亿美元

据《华尔街日报》报道,Anthropic 正在敲定一项协议,计划于周一与 BlackRock、Goldman Sachs 以及其他华尔街公司成立一家合资企业,旨在向由私募股权支持的公司销售人工智能工具。该合资企业预计将作为 Anthropic 的咨询部门,

GateNews2小时前

中国阻止 Meta 的 US$2B Manus AI 收购

中国宣布将阻止 Meta 价值 20 亿美元的收购 AI 代理公司 Manus,理由是担忧将中国的人工智能知识产权转移给美国公司。根据 Tech in Asia 的报道。 Manus 是一家由中国创立的公司,将其总部迁至

Crypto Frontier2小时前

腾讯在最新 Hy3 模型训练中使用了 Anthropic 的 Claude Code,《信息》报道称

据《The Information》援引内部腾讯备忘录和消息人士称,尽管 Anthropic 明确禁止向以国家为由的中国公司提供商业服务(相关内容未完句)且理由为国家…,腾讯员工在公司最新大型语言模型 Hy3 的后训练阶段使用了 Anthropic 的 Claude Code。

GateNews3小时前
评论
0/400
暂无评论