Vera Rubin:NVIDIA 正在为 2026 年准备的静默变革

在标志着其战略重大转变的一次行动中,NVIDIA选择不在2026年国际消费电子展(CES 2026)展示消费级显卡。相反,黄仁勋登上舞台,带来了更具雄心的项目:一台重达2.5吨的计算平台,承诺重新定义人工智能模型的训练和推理。

当芯片设计打破自身规则

真正的惊喜不在于机架的大小,而在于其内部结构。Vera Rubin平台(以发现暗物质的天文学家命名),打破了NVIDIA多年来坚持的一条内部规则:每一代产品最多只重新设计1-2颗芯片。

这一次,公司同时重新设计了6颗不同的芯片,完成了开发周期,直接进入大规模生产。原因很实际:摩尔定律放缓,但AI模型仍然要求每年性能增长10倍。唯一的解决方案是创新,不仅在某个组件上,而是在整个架构上。

Vera Rubin的六大支柱

Vera CPU: 采用88个定制的奥林巴斯(Olympus)核心,具备同时处理176个线程的能力。其系统内存达到1.5TB,是前代Grace的三倍,NVLink C2C带宽为1.8TB/s。

Rubin GPU: 推理的真正引擎。提供50 PFLOPS的NVFP4算力,是之前Blackwell架构的五倍。拥有3360亿个晶体管,集成第三代Transformer引擎,可根据模型动态调整精度。

连接与存储: ConnectX-9提供800 Gb/s以太网。BlueField-4 DPU处理新一代AI存储,结合64核Grace CPU,带宽达800 Gb/s。

通信基础设施: NVLink-6交换芯片连接18个计算节点,使多达72个Rubin GPU作为一个系统运行,带宽达到3.6TB/s的全互联。Spectrum-6增加了512个200 Gbps的光学通道,得益于台积电COOP的硅光子集成。

数字上的影响:当投资倍增

Vera Rubin的NVL72系统在NVFP4推理任务中达到3.6 EFLOPS,是Blackwell的五倍。在训练方面达到2.5 EFLOPS,提升了3.5倍。但最令人震惊的是内存:54 TB的LPDDR5X(是原来的三倍),20.7 TB的HBM(是1.5倍)。

对于一个成本达500亿美元、功率为1 GW的数据中心来说,这不仅是技术上的提升。意味着每瓦和每美元生成的AI令牌吞吐量提升了10倍,直接翻倍基础设施的收入能力。

训练一个参数量达10万亿的模型,现在只需使用之前Blackwell系统的四分之一。每个生成的令牌成本降低到之前的约十分之一。

解决瓶颈:上下文存储器

数月来,AI行业面临一个日益严重的问题:模型生成的“KV缓存”或工作内存在长对话中迅速耗尽。Vera Rubin通过在机架内部署BlueField-4处理器解决了这个问题,每个拥有150 TB的上下文内存。

这种方法为每个GPU提供了额外的16 TB内存(,原本只有大约1 TB),同时保持200 Gbps的带宽而不牺牲速度。专为生成式AI设计的Spectrum-X网络,确保这些散布在数千GPU中的“便签”作为一个统一的内存系统高效运行。

黄仁勋估算,Spectrum-X可以将吞吐量提升25%,相当于在同等规模的数据中心节省50亿美元。“几乎是免费的,”他总结道。

每层加密保障安全

所有传输、存储和计算中的数据都经过加密,包括PCIe总线、NVLink通信和CPU-GPU传输。企业可以在外部系统部署模型,无需担心数据泄露。

向物理AI和智能代理的转变

在Vera Rubin提供强大算力的同时,NVIDIA宣布了更深层次的范式转变:智能代理和物理AI的时代已经到来。

黄仁勋特别呼吁开源社区,强调去年DeepSeek V1作为首个开源推理系统震惊了世界,引发了一波创新浪潮。他提到Kimi K2和DeepSeek V3.2在开源领域的领导地位,证明NVIDIA现在是在构建这个生态系统,而不是与之竞争。

其战略不仅仅是销售“铲子”。NVIDIA开发了价值数十亿美元的超级计算机DGX Cloud(,以及蛋白质合成模型)“蛋白质”(和OpenFold 3。其开源家族Nemotron包括语音、多模态、增强检索和安全模型。

Alpamayo:具备推理能力的自动驾驶

此次展会的真正惊喜是Alpamayo,这是全球首个具有思考和推理能力的自动驾驶系统。不同于基于规则的自动驾驶,Alpamayo像人类司机一样推理,将复杂场景拆解为常识元素。

“它会告诉你下一步会做什么,以及为什么做出这个决定,”黄仁勋解释道。搭载该技术的梅赛德斯CLA将在2026年第一季度在美国推出,被NCAP评为全球最安全的汽车,得益于NVIDIA开发的“双重安全堆叠”架构。

机器人、工厂与物理AI的未来

NVIDIA提出了全面的机器人战略。所有机器人都将配备Jetson迷你计算机,并在Omniverse平台的Isaac模拟器中进行训练。目标明确:芯片设计、系统架构和工厂仿真,全部由物理AI加速。

黄仁勋邀请波士顿动力和Aility的 humanoid 和四足机器人登台,强调工厂本身就是最大的机器人。甚至迪士尼的机器人也在电脑上训练并在模拟中验证,然后再面对现实世界的重力。

背后的信息

在对“AI泡沫”的怀疑日益增长、摩尔定律的限制变得明显的背景下,黄仁勋需要用具体事实证明AI的潜力。

过去,NVIDIA制造虚拟世界的芯片。现在,他们自己展示了物理AI——以自动驾驶和 humanoid 机器人的形式,正逐步走入现实世界。正如他说的,当战斗开始时,“军事工业”的生意也能真正繁荣。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt