具身智慧（Embodied AI）正迎來一個關鍵轉折點。中國智元機器人近期發布 Genie Envisioner World Simulator 2.0（GE-Sim 2.0），試圖將 World Model（世界模型）從單純理解環境的工具，推進為可以直接運行、訓練與優化機器人的世界模擬器（World Simulator）。

如果你還不了解這有多關鍵，不妨先看看 LLM 架構的硬傷：訓練邏輯上現存 LLM 只是根據龐大語料庫來預測上下文，它可以知道「蘋果掉下來」這幾個字常一起出現，但並不真正理解重力或物理世界的因果關係。

這就是為什麼楊立昆、李飛飛等科學家都投身於 World Model 賽道，當 AI 具備對 3D 環境的理解與物理預測能力後，這項技術將成為自主機器人、自動駕駛與智慧製造等「實體AI」（Physical AI）的數位大腦。因此，World Model 的路線主張，機器人將會是十分關鍵的載體。如今等身機器人廠商智元機器人入局，象徵中國從硬體逆襲的先鋒。

先前台積電董事長魏哲家曾表示：如果看中國大陸一直弄機器人可跳來跳去蹦蹦跳。那個沒用，只是好看頭而已。他指出關鍵在於要讓機器人大腦能運作，而大腦誰在做，輝達 (Nvidia)、超微 (AMD) 與一堆美國公司，但 95% 大腦是台積電製造。GE-Sim 2.0 發展瓶頸仍在，與中國的模型發展強綁定。

World Model 的路線主張，機器人是關鍵

當前主流的 LLM 依靠龐大的語料庫與統計關係來理解上下文，並預測下一個詞語。它可以知道「蘋果掉下來」這幾個字常一起出現，但並不真正理解重力或物理世界的因果關係。

這種模式在文本生成、程式輔助或問答任務上表現出色，但在需要理解現實世界結構、推理因果關係與長期規劃的場景中，仍存在根本限制。更大的問題在於數據來源正在逐漸枯竭。LLM 的訓練高度依賴高品質人類資料，而近年業界已開始警告，可用的人類文本資料可能在未來幾年內被消耗殆盡。屆時就像近親繁殖可能遺傳缺陷，最終導致模型逐漸偏離現實並出現性能退化。

(深度解析：LLM 存在缺陷？為何楊立昆的 AMI 押注 World Model 路線)

這也是為什麼近年 AI 學界兩位重量級人物楊立昆與被稱為「AI 教母」的李飛飛（Fei-Fei Li）都選擇押在被稱為 World Model（世界模型）的新一代 AI 架構。

當時筆者曾表示：延伸來看，當 AI 具備對 3D 環境的理解與物理預測能力後，這項技術將成為自主機器人、自動駕駛與智慧製造等「實體AI」（Physical AI）的數位大腦。因此，World Model 的路線主張，機器人將會是十分關鍵的載體。如今等身機器人廠商智元機器人入局，象徵中國從硬體逆襲的先鋒。

先前台積電董事長魏哲家，在談及機器人與半導體發展時直言，如果看中國大陸一直弄機器人可跳來跳去蹦蹦跳。那個沒用，只是好看頭而已。他指出關鍵在於要讓機器人大腦能運作，而大腦誰在做，輝達 (Nvidia)、超微 (AMD) 與一堆美國公司，但 95% 大腦是台積電製造。

(台積電魏哲家酸：中國機器人蹦蹦跳，只是好看頭沒用！關鍵仍來自輝達)

World Model 進化：從理解世界，到在世界中學習

過去幾年，World Model 一直被視為 AI 理解現實的關鍵技術。透過影像、語言與感測數據，模型可以預測環境變化，讓機器人具備基本決策能力。

但 GE-Sim 2.0 的核心突破在於不只是理解世界，而是直接在「模型生成的世界」中學習與行動系統將行動（Action）納入核心變數，從傳統的狀態預測，升級為完整循環：

State

Action

State Evolution

這意味著，機器人不再只是觀察與回應，而是能在模擬環境中主動試錯、自主優化、持續學習。這種轉變，使 World Model 從「認知模型」進化為「訓練基礎設施」。

GE-Sim 2.0：讓機器人在虛擬世界中「進化」

GE-Sim 2.0 被定義為一套「具身世界模擬器」，核心目標是解決現實訓練的三大瓶頸：成本過高、數據不足、難以規模化。透過模型生成環境，系統可以在不依賴真實世界的情況下，大規模訓練機器人。

技術上，GE-Sim 2.0 整合三個關鍵能力：首先是「動作驅動影像生成」，模型能根據機器人動作生成對應的未來畫面，並保持多視角一致性，包括頭部視角與左右手操作視角。

其次是本體感知（proprioception）建模，不只模擬外部畫面，還能預測機器人自身關節與動作狀態，讓決策更接近真實物理世界。

第三是「自動任務評估」，透過內建的 reward model（獎勵模型），系統可自動判斷任務是否完成，例如「將藍色物體放入紅色盒子」，並給出回饋，直接用於強化學習。這使得機器人可以在模擬環境中完成完整閉環：

GE-Sim 2.0 已能實現「分鐘級」穩定影片生成

相較早期模型僅能生成短片段，GE-Sim 2.0 已能實現「分鐘級」穩定影片生成，支援長時間任務模擬。同時，透過大規模真實數據（遠端操作、部署與交互數據）訓練，模型在不同場景與任務間具備更強泛化能力。這一點對於人形機器人尤其關鍵：因為現實世界的操作高度多變，無法單靠固定場景訓練。

World Simulator 的出現，意味著機器人可以在虛擬世界中「無限練習」這將帶來兩個結構性變化：第一，訓練成本大幅下降。第二，能力迭代速度呈指數級提升。

智元機器人：中國人形機器人新勢力

智元機器人成立於 2023 年，由華為「天才少年」彭志輝創辦，專注於 AI 與機器人融合的具身智能領域。

公司核心產品包括：

「遠征」系列人形機器人

「靈犀」機器人系統

通用大模型 GO-1

目前已完成多輪融資，並獲紅杉中國、高瓴資本等機構投資，被視為中國人形機器人領域的重要玩家，與宇樹科技形成競爭格局。

這篇文章智元 GE-Sim 2.0：用 World Model 生成世界，宇樹勁敵將人形機器人推向自我進化最早出現於鏈新聞 ABMedia。

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

蘋果同意支付 2.5 億美元，與 Apple Intelligence 集體訴訟和解

AI 行業動態

根據 BBC 於 5 月 6 日的報道，蘋果公司（Apple）於 5 月 5 日在加州聯邦法院提交擬議和解協議，同意支付 2.5 億美元（約 1.84 億英鎊），以與指控其就 Apple Intelligence 及 Siri AI 功能進行虛假廣告宣傳的集體訴訟和解；蘋果在協議中否認任何不當行為，協議仍須法官批准。

Market Whisper2分鐘前

騰訊 Hunyuan Hy3 預覽顯示兩週內代幣成長 10 倍

AI 行業動態

自兩週前推出以來，騰訊 Hunyuan 的 Hy3 預覽相較於先前的 Hy2 模型，在代幣呼叫方面成長了 10 倍。程式碼與代理情境中的代幣用量尤其大幅攀升，包含 WorkBuddy、Codebuddy 與 Qclaw 等應用程式皆表示成長迅速

GateNews11分鐘前

馬斯克曾考慮於 2017 年底將 OpenAI 納入特斯拉，法院聽取稱

AI 行業動態

根據在加州奧克蘭舉行的聯邦審判中的證詞，Neuralink 執行長、也是前 OpenAI 董事會成員 Shivon Zilis 表示，Elon Musk 在 2017 年底到 2018 年初曾考慮將 OpenAI 合併進 Tesla。Zilis 證稱，Musk 探索過向 Sam Altman 提供一個 Tesla 董事會席次

GateNews31分鐘前

Gemini 與 Claude 使用者成長在 4 月加速，而 ChatGPT 成長放緩至 30% 年增（YoY）

AI 行業動態

根據美國銀行（Bank of America）最新報告，Gemini 和 Claude 在 4 月見到強勁的用戶成長，而 ChatGPT 的擴張則放緩。在美國的網頁瀏覽中，ChatGPT 的年增 30% 至 3400 萬次瀏覽（相當於 Google 流量的 6%），而 Claude 則年增 715% 飆升至 7.1 百萬次

GateNews38分鐘前

OpenAI 與 AMD、博通（Broadcom）、英特爾（Intel）、微軟（Microsoft）以及輝達（Nvidia）推出 MRC Protocol

AI 行業動態

OpenAI 宣布已與 AMD、Broadcom、Intel、Microsoft 和 Nvidia 合作推出 Multipath Reliable Connection（MRC），這是一種開源網路協定。MRC 的設計目標是加速大規模 AI 訓練叢集、提升可靠性，並大幅降低 GPU 閒置

GateNews40分鐘前

SK 電信的 AI 數據中心營收在 2026 年第 1 季成長 89%

AI 行業動態

根據 SK Telecom，南韓電信業者的人工智慧資料中心業務在 2026 年第一季度創下 1314億韓元（89.4 百萬美元）營收，年增 89.3%。公司將成長歸因於更高的資料中心利用率以及

GateNews51分鐘前

留言

0/400

暫無留言