小米揭露 MiMo-V2-Pro 訓練細節:1T 模型參數,部署數千台 GPU

Gate 新聞訊息,4 月 24 日——小米大型語言模型團隊負責人 羅福立 在一場深入採訪中披露,MiMo-V2-Pro 模型總計擁有 1 兆(trillion)參數,訓練過程需要數千台 GPU。她指出,1T 規模代表達成性能接近 Claude Opus 4.6 等級所需的最低門檻,並取得下一階段 AI 代理的競爭性入場票。

技術層面,Pro 版本採用極致稀疏注意力機制,將全域注意力與滑動視窗注意力的比例設為 7:1,以控制長上下文處理的推論成本。模型也保留了 MTP (Multi-Token Prediction) 架構,利用剩餘算力以實現更快的推論。

在管理方面,100 人規模的 MiMo 團隊中,只有 30-40 人直接參與核心迭代。團隊運作不設正式階層,也沒有明確的分組或交付截止期限。當遇到不穩定的數值問題,例如訓練損失激增時,團隊會優先考慮暫停訓練以便調查,即使這意味著停止運作一到兩週,並因此產生數百萬美元的算力成本。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

哈佛醫學院最新研究:AI 在急診室診斷決策優於人類醫生

哈佛醫學院在《科學》發表的研究,透過雙盲測試與臨床推理評估,客觀比較 AI 系統與人類醫師在病歷判讀上的差異。結果顯示,AI 在急診早期決策點可與主治醫師同等或更優,且僅憑當時可得的電子病歷資訊。研究同時強調 AI 尚無法自主行醫,醫師仍不可或缺;若廣泛運用,AI 可降低診斷錯誤與就醫成本。

鏈新聞abmedia15分鐘前

南韓前 10 大財閥獲利成長 65%,至 2.6 萬億美元,隨著 AI 晶片股反彈而走高

根據《The Korea Herald》,南韓前 10 大財閥的合計市值上漲 65%,達 3,832.7 兆韓元(US$2.6 兆美元),受惠於 AI 相關晶片股的反彈。SK Group 以上漲 89.6% 至 1,139.8 兆韓元(US$7750 億美元)表現最佳,帶動其

GateNews18分鐘前

AI 投資推動了 75% 的美國 GDP 第 1 季成長,白宮顧問表示

根據白宮 AI 和加密貨幣顧問 David Sacks 的說法,他就 5 月初發布的摩根士丹利數據發表評論指出,2026 年第一季度與 AI 相關的投資貢獻了美國 GDP 成長約 75%。Sacks 表示,AI 投資今年將推動約 2.5% 的 GDP 成長,並且

GateNews23分鐘前

AI 人才在新加坡的薪資最高可比其他地區高 25%,NodeFlair 報告顯示

根據 NodeFlair 於 2026 年 5 月 4 日發布的《技術薪資報告》,在新加坡具備 AI 技能的軟體工程師所獲得的薪資比沒有此類專長的同儕高出 13% 到 25%。該研究結果係基於超過 230,000 筆經驗證的薪資資料點。 薪資調升幅度因職涯等級而異,包含

GateNews1小時前

POLITICO 民調:45% 的美國人 認為 加密貨幣 投資風險太高,50% 更信任 銀行

根據 POLITICO 的一項民調,45% 的美國人認為加密貨幣投資不值得冒險,而約 50% 的受訪者表示他們更信任傳統銀行來保護他們的資金。該民調也發現,44% 的受訪者認為人工智慧發展得太快,

GateNews9小時前

Amazon 與 OpenAI 擴大合作:模型上架 Bedrock、微軟獨家結束

OpenAI 5 月 3 日宣布與亞馬遜雲端服務(AWS)擴大合作、OpenAI 模型與 Codex 編碼代理將透過 Amazon Bedrock 提供給 AWS 客戶使用。根據 CNBC 報導,本次擴大是在 4 月底 OpenAI 與微軟(Microsoft)終止雲端獨家合約後的關鍵下一步—OpenAI 從「微軟雲端唯一」轉向多雲端部署。AWS 同期已完成 OpenAI 產品在 Bedrock 平台的初步整合。 背景:OpenAI-微軟獨家合約結束、IP 授權延至 2032 年 4 月底 OpenAI 與微軟達成新協議:原本的「微軟對 OpenAI 產品與 IP 獨家存取」結構結束、Op

鏈新聞abmedia10小時前
留言
0/400
暫無留言