Gate News 消息,4月24日——小米的大语言模型团队负责人罗福丽在一场深入采访中透露,MiMo-V2-Pro 模型的总参数量达到 1 万亿,并且训练过程中需要成千上万台 GPU。她表示,1T 规模代表要实现接近 Claude Opus 4.6 等级的性能,并为下一阶段 AI 智能体抢占具备竞争力的入场券所达到的最低门槛
从技术层面看,Pro 版本采用极端稀疏注意力机制,在全局注意力与滑动窗口注意力之间的比例为 7:1,从而在长上下文处理时控制推理成本。模型还保留了 MTP (Multi-Token Prediction) 架构,以利用富余的计算能力实现更快的推理。
在管理层面,100 人规模的 MiMo 团队中,直接参与核心迭代的只有 30-40 人。团队在没有正式层级或明确子分组划分的情况下运作,也没有交付截止期限。遇到诸如训练损失突增这类不稳定的数值问题时,团队会优先考虑停止训练以进行排查,即使这意味着停止业务一到两周,并产生数百万美元的计算成本。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Amazon 与 OpenAI 扩大合作:模型上架 Bedrock、微软独家结束
OpenAI 5 月 3 日宣布与亞马遜雲端服務(AWS)擴大合作,OpenAI 模型与 Codex 編碼代理將透过 Amazon Bedrock 提供給 AWS 客戶使用。根據 CNBC 报導,本次擴大是在 4 月底 OpenAI 与微软(Microsoft)終止雲端獨家合约后的关鍵下一步—OpenAI 从「微软雲端唯一」转向多雲端部署。AWS 同期已完成 OpenAI 产品在 Bedrock 平台的初步整合。
背景:OpenAI-微软獨家合约結束、IP 授權延至 2032 年
4 月底 OpenAI 与微软达成新協议:原本的「微软对 OpenAI 产品与 IP 獨家存取」結構結束、Op
鏈新聞abmedia2小时前
研究人员部署 DPN-LE 技术以编辑 AI 个性特征,仅编辑 0.5% 的神经元
据 BlockBeats 报道,5 月 3 日,AI 研究员 Brian Roemmele 披露其 Zero-Human Company 已部署 DPN-LE(Dual Personality Neuron Localization and Editing)技术,以精确调整
GateNews3小时前
Claude 在获得时间工具访问权限后,每 15 分钟检查一次时钟
据开发者 Om Patel 称,Claude AI 在 5 月 3 日获得对时间工具的访问权限后开始频繁查看时钟;该模型每 15 分钟检查一次。该观察表明,大型语言模型此前缺乏原生的时间感知能力,并且并不知道当前时间或
GateNews4小时前
Founders Fund 在 5 月 3 日关闭 60 亿美元旗舰基金,自成立以来规模最大
根据彭博社,Founders Fund 于 5 月 3 日以 60 亿美元完成其最新旗舰基金的募资,显著超过其上一期基金约 34 亿美元。该基金由亿万富翁 Peter Thiel 联合创立,将聚焦包括人工在内的高增长领域
GateNews4小时前
最新 POLITICO 民调:45% 的美国人表示加密货币投资风险太高,44% 担心 AI 进展过快
据 POLITICO 的一项民意调查,尽管 AI 和加密货币行业向 2026 年美国中期选举注入了大量政治资金,美国公众仍大多对这两个领域持怀疑态度。调查发现,45% 的美国人认为投资加密货币不值得
GateNews5小时前
OpenAI 弗萊爾倡 2027 IPO、阿特曼支持 Q4 2026 上市
OpenAI 财务长莎拉·弗莱尔对 2026 年 IPO 时程持谨慎态度,指出近 1 兆美元的算力与数据中心合约远高于当前年化营收 250 亿美元,若增长无法覆盖承诺,风险将被市场折价。与 CEO 阿特曼公开主张的 2026 年 Q4 上市分歧显现,弗莱尔倾向推迟至 2027 年以建立财务纪律;公司多次发表声明否认内部分歧。
鏈新聞abmedia7小时前