小米大模型負責人:AI 競爭轉向 Agent 時代,自進化是 AGI 關鍵事件

AI自進化

小米大模型團隊負責人羅福莉於 4 月 24 日在嗶哩嗶哩平台接受深度訪談(影片號:BV1iVoVBgERD),訪談時長 3.5 小時,為其首次以技術負責人身份公開系統性闡述技術觀點。羅福莉稱,大模型競爭賽道已從 Chat 時代轉入 Agent 時代,並指出「自進化」將是未來一年 AGI 關鍵事件。

Chat 時代到 Agent 時代:核心技術判斷

小米大模型團隊負責人羅福莉訪談

(來源:嗶哩嗶哩)

根據羅福莉在 Bilibili 訪談中的陳述,她指出 2026 年大模型競爭的重心已從通用對話品質轉向在複雜任務中的持續自主執行能力。她在訪談中表示,目前頂尖模型已能在特定任務中自主最佳化,並持續穩定執行 2 至 3 天,不需要人類介入調整。她在訪談中強調,「自進化」能力的突破代表 AI 系統開始具備自我修正能力,並點名 Anthropic 的技術路徑以及 Claude Opus 4.6 等技術變數對整個 AI 生態的影響。

小米算力配比調整與 Pre-train 代差評估

根據羅福莉在訪談中的披露,小米在算力分配策略上已進行重大調整。她說明,業界慣用的算力配比為 Pre-train:Post-train:Inference = 3:5:1,而小米當前策略已調整為 3:1:1,大幅壓縮後訓練比例,同步提升推理階段的資源投入。

她在訪談中解釋,這一轉變源於 Agent RL Scaling 策略的成熟,使後訓練不再需要大量算力堆疊,而推理端資源的提升反映了 Agent 落地場景對即時響應能力的需求。

對於國內大模型的 Pre-train 代差問題,羅福莉在訪談中表示,這一差距已從過去的 3 年縮短至數月,當前的策略重心正向 Agent RL Scaling 移動。羅福莉的職涯歷程涵蓋阿里達摩院、幻方量化及 DeepSeek(DeepSeek-V2 核心開發者),於 2025 年 11 月加入小米。

MiMo-V2 系列技術規格與開源排名

根據小米官方於 2026 年 3 月 19 日發布的 MiMo-V2 系列公告,此次一次發布三款模型:

MiMo-V2-Pro:兆總參數,啟用參數 42B,混合注意力架構,支援百萬上下文,任務完成率 81%

MiMo-V2-Omni:全模態 Agent 場景

MiMo-V2-TTS:語音合成場景

根據公告,已開源的 MiMo-V2-Flash 在全球開源模型排行榜位列第二,推理速度達 DeepSeek-V3.2 的 3 倍。

常見問題

羅福莉如何定義「自進化」,為何認為其是 AGI 最關鍵事件?

根據羅福莉 2026 年 4 月 24 日在 Bilibili 的訪談陳述(BV1iVoVBgERD),她在訪談中指出,目前頂尖模型已能在特定任務中自主最佳化並穩定執行 2 至 3 天而無需人類介入,並將「自進化」定性為未來一年 AGI 發展最關鍵的事件。

小米在算力配比上做了哪些具體調整,背後邏輯為何?

根據羅福莉在訪談中的披露,小米的算力配比已從業界慣用的 Pre-train:Post-train:Inference = 3:5:1 調整為 3:1:1,大幅壓縮後訓練比例;她解釋這一調整源於 Agent RL Scaling 策略成熟後後訓練效率提升,以及 Agent 落地場景對推理端即時響應能力的需求。

MiMo-V2-Flash 的開源排名與速度表現如何?

根據小米 2026 年 3 月 19 日發布的官方公告,已開源的 MiMo-V2-Flash 在全球開源模型排行榜位列第二,推理速度達 DeepSeek-V3.2 的 3 倍,旗艦版 MiMo-V2-Pro 的任務完成率為 81%。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Cardano 創辦人:AI 代理將在 2035 年前超越人類的網際網路活動,並打亂以廣告為驅動的模型

根據 CoinDesk,Cardano 創辦人 Charles Hoskinson 在 5 月 7 日的 Consensus 會議上預測,AI 代理將在 2035 年超越人類在網路搜尋、商務和交易方面的活動。Hoskinson 表示,由於 AI 代理不會點擊廣告,也不會表現出品牌偏好,因此這種情況將

GateNews1小時前

Claude Code負責人Boris:AI代理提升人類生產力,改寫軟體開發歷史

Claude Code負責人Boris Cherny在CNBC訪談指出AI代理工具如Co-Work能將繁瑣任務交給AI處理,工程師從操作者轉為引導者,能同時啟動多個代理處理除錯,顯著提升產能。企業須把AI當核心重組流程,AI皆在各行各業展現價值,軟體開發將由編寫轉向以邏輯與對話指引的協作,技術門檻降低,創新創業將出現爆發性增長。

鏈新聞abmedia2小時前

瑞德·霍夫曼:NFT 可能會回歸,因為 AI 代理需要加密信任

Reid Hoffman,Greylock 合夥人兼 LinkedIn 共同創辦人,表示自主代理將需要基於加密貨幣的信任系統,才能在開放式互聯網上進行交易,並指出根據他的說法,NFT 可能會捲土重來。 AI 代理與信任基礎設施 Hoffman 的發言指向一個可能的

Crypto Frontier3小時前

IBM 在 Think 2026 以新的基於代理的工具擴充企業 AI 套件

根據 IBM 公司的說法,該公司在波士頓舉行的 Think 2026 會議上宣布擴展其企業 AI 能力,推出新的基於代理的工具,協助組織將人工智慧嵌入日常運作。Context Studio 現已全面提供,讓企業能夠

GateNews5小時前

Anthropic 推 Claude Dreams:Agent 在工作之間自整理記憶、消除重複與矛盾

Anthropic 在 Code with Claude 大會公布 Dreams,讓 Claude Managed Agents 在多場會話間自動整理記憶、消除重複與矛盾、更新陳舊條目,輸出可審核的整理後記憶庫;輸入上限為 100 個 session 與 4,096 字元,非同步執行,數分鐘至數十分鐘完成,支援串流觀察。研究預覽需申請,暫只支援 claude-opus-4-7 與 claude-sonnet-4-6,正式上市未定。

鏈新聞abmedia8小時前

Cloudflare 攜手 Stripe 推 Agent 自主協議:AI 可自建帳戶、買網域、部署應用

Cloudflare 與 Stripe 4 月 30 日共同推出新協議、讓 AI Agent 可在無人工介入下自行建立 Cloudflare 帳戶、訂閱付費方案、註冊網域、取得 API token、並直接部署應用程式。Cloudflare 官方部落格說明、整套流程從頭到尾不需要人類進入後台、複製貼上 token、或輸入信用卡資料;用戶只需先給予許可、並接受 Cloudflare 的使用條款。本週此公告在 Hacker News 取得 548 分、成為 AI Agent 自主執行任務的標誌性基礎建設新聞之一。 三層協議架構:服務發現、身分授權、付款代幣化 Cloudflare-Stripe

鏈新聞abmedia8小時前
留言
0/400
暫無留言