Vera Rubin: NVIDIA 正在為 2026 年準備的默默轉型

在一個標誌著策略重大轉變的舉措中,NVIDIA 選擇不在 2026 年消費級顯示卡展(CES)展示產品。相反,黃仁勳登上舞台,帶來更宏大的計畫:一個重達 2.5 噸的運算平台,承諾重新定義人工智慧模型的訓練與推理。

當晶片設計打破自身規則

真正的驚喜不在於機架的大小,而在於其內部組成。Vera Rubin 平台(以那位發現暗物質的天文學家命名),打破了 NVIDIA 多年來堅持的內部規則:每一代產品最多只重新設計 1-2 顆晶片。

這次,該公司同時重新設計了 6 顆不同晶片,完成開發週期並直接進入量產。原因很務實:摩爾定律放緩,但 AI 模型仍需每年性能成長 10 倍。唯一的解決方案是整個架構的創新,而非單一元件。

Vera Rubin 的六大支柱

Vera CPU: 以 88 核 Olympus 定制核心為核心,能同時處理 176 線。系統記憶體達到 1.5 TB,是前代 Grace 的三倍,NVLink C2C 帶寬為 1.8 TB/s。

Rubin GPU: 推動推理的真正引擎。提供 NVFP4 50 PFLOPS 的算力,是前一代 Blackwell 架構的五倍。擁有 3360 億個晶體管,集成第三代 Transformer 引擎,能根據模型動態調整精度。

連接與存儲: ConnectX-9 提供 800 Gb/s 以太網。BlueField-4 DPU 處理新一代 AI 存儲,結合 64 核 Grace CPU 和 800 Gb/s 傳輸能力。

通信基礎設施: NVLink-6 交換晶片連接 18 個計算節點,使最多 72 個 Rubin GPU 作為單一系統運作,擁有 3.6 TB/s 的全域帶寬。Spectrum-6 增加 512 個 200 Gbps 光纖通道,得益於台積電 COOP 矽光子整合。

數字上的影響:投資倍增

Vera Rubin 的 NVL72 系統在 NVFP4 推理任務中達到 3.6 EFLOPS,較 Blackwell 高出五倍。在訓練方面,達到 2.5 EFLOPS,提升 3.5 倍。但最令人震驚的是記憶體:54 TB LPDDR5X (是前代的三倍),以及 20.7 TB HBM (是前代的 1.5 倍)。

對於一個 1 GW、成本 500 億美元的資料中心來說,這不僅是技術上的進步。它意味著每瓦和每美元產生的 AI 代幣吞吐量提升 10 倍,直接翻倍基礎設施的收入能力。

訓練一個擁有 10 兆參數的模型,現在只需使用前代 Blackwell 系統的四分之一。每個代幣的生成成本降低到原來的約十分之一。

解決瓶頸:上下文記憶體

數月來,AI 行業面臨一個日益嚴重的問題:模型產生的“KV 快取”或工作記憶體,在長對話中迅速耗盡。Vera Rubin 透過在機架內部署 BlueField-4 處理器來解決,每個擁有 150 TB 的上下文記憶體。

此方法為每個 GPU 提供額外 16 TB 記憶體(,原本僅約 1 TB),且保持 200 Gbps 的帶寬,未犧牲速度。專為生成式 AI 設計的 Spectrum-X 網路,確保這些散布在數千 GPU 的“便條紙”能像一個一致的記憶體一樣運作。

黃仁勳估計 Spectrum-X 可提升 25% 的吞吐量,等同於在此規模資料中心節省 50 億美元。“幾乎是免費的,”他總結。

每層加密的安全保障

所有傳輸、存儲與計算中的資料都經過加密,包括 PCIe、NVLink 通訊與 CPU-GPU 傳輸。企業可以在外部系統部署模型,無需擔心資料洩漏。

向物理 AI 與代理智能的轉型

在 Vera Rubin 提供強大算力的同時,NVIDIA 宣布更深層次的範式轉變:代理智能與物理 AI 時代已來臨。

黃仁勳特別呼籲開源社群,強調去年 DeepSeek V1 作為首個開源推理系統震驚世界,掀起創新浪潮。他提到 Kimi K2 和 DeepSeek V3.2 在開源領域的領導地位,證明 NVIDIA 現在是在建立這個生態系,而非與之競爭。

策略不僅是販售工具。NVIDIA 開發了價值數十億美元的超級電腦 DGX Cloud (,以及尖端模型如蛋白質合成的 synthesia )“蛋白質”( 和 OpenFold 3。其開源家族 Nemotron 包含語音、多模態、增強式檢索與安全等模型。

Alpamayo:具備推理能力的自主駕駛

此次展會的最大驚喜是 Alpamayo,全球首款具備思考與推理能力的自主駕駛系統。與基於規則的自動駕駛不同,Alpamayo 以類似人類司機的方式推理,將複雜場景拆解為常識元素。

“它會告訴你下一步會做什麼,以及為何做出這個決定,”黃仁勳解釋。搭載此技術的梅賽德斯 CLA,將於 2026 年第一季在美國推出,並因其“雙重安全堆疊”架構被 NCAP 評為全球最安全的車輛,這是 NVIDIA 所開發的。

機器人、工廠與物理 AI 的未來

NVIDIA 展示了一個完整的機器人策略。所有機器人都將配備 Jetson 小型電腦,並在 Omniverse 平台的 Isaac 模擬器中訓練。願景很清楚:晶片設計、系統架構與工廠模擬,皆由物理 AI 加速。

黃仁勳邀請 Boston Dynamics 和 Agility 的人形與四足機器人登台,強調工廠本身就是最大型的機器人。甚至迪士尼的機器人也在電腦中訓練並在模擬中驗證,才敢在現實中面對重力。

背後的訊息

在對“AI泡沫”的懷疑日增、摩爾定律的限制逐漸顯現的背景下,黃仁勳需要用具體事實證明 AI 能達成的成就。

過去,NVIDIA 製造虛擬世界的晶片。如今,他們自己展示物理 AI——以自動駕駛與人形機器人形式,正逐步進入現實世界。正如他所說,當戰鬥開始,所謂的“軍事工業”事業真的可以繁榮起來。

DEEPSEEK-8.67%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)