Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
Vera Rubin:NVIDIA 正在为 2026 年准备的静默变革
在标志着其战略重大转变的一次行动中,NVIDIA选择不在2026年国际消费电子展(CES 2026)展示消费级显卡。相反,黄仁勋登上舞台,带来了更具雄心的项目:一台重达2.5吨的计算平台,承诺重新定义人工智能模型的训练和推理。
当芯片设计打破自身规则
真正的惊喜不在于机架的大小,而在于其内部结构。Vera Rubin平台(以发现暗物质的天文学家命名),打破了NVIDIA多年来坚持的一条内部规则:每一代产品最多只重新设计1-2颗芯片。
这一次,公司同时重新设计了6颗不同的芯片,完成了开发周期,直接进入大规模生产。原因很实际:摩尔定律放缓,但AI模型仍然要求每年性能增长10倍。唯一的解决方案是创新,不仅在某个组件上,而是在整个架构上。
Vera Rubin的六大支柱
Vera CPU: 采用88个定制的奥林巴斯(Olympus)核心,具备同时处理176个线程的能力。其系统内存达到1.5TB,是前代Grace的三倍,NVLink C2C带宽为1.8TB/s。
Rubin GPU: 推理的真正引擎。提供50 PFLOPS的NVFP4算力,是之前Blackwell架构的五倍。拥有3360亿个晶体管,集成第三代Transformer引擎,可根据模型动态调整精度。
连接与存储: ConnectX-9提供800 Gb/s以太网。BlueField-4 DPU处理新一代AI存储,结合64核Grace CPU,带宽达800 Gb/s。
通信基础设施: NVLink-6交换芯片连接18个计算节点,使多达72个Rubin GPU作为一个系统运行,带宽达到3.6TB/s的全互联。Spectrum-6增加了512个200 Gbps的光学通道,得益于台积电COOP的硅光子集成。
数字上的影响:当投资倍增
Vera Rubin的NVL72系统在NVFP4推理任务中达到3.6 EFLOPS,是Blackwell的五倍。在训练方面达到2.5 EFLOPS,提升了3.5倍。但最令人震惊的是内存:54 TB的LPDDR5X(是原来的三倍),20.7 TB的HBM(是1.5倍)。
对于一个成本达500亿美元、功率为1 GW的数据中心来说,这不仅是技术上的提升。意味着每瓦和每美元生成的AI令牌吞吐量提升了10倍,直接翻倍基础设施的收入能力。
训练一个参数量达10万亿的模型,现在只需使用之前Blackwell系统的四分之一。每个生成的令牌成本降低到之前的约十分之一。
解决瓶颈:上下文存储器
数月来,AI行业面临一个日益严重的问题:模型生成的“KV缓存”或工作内存在长对话中迅速耗尽。Vera Rubin通过在机架内部署BlueField-4处理器解决了这个问题,每个拥有150 TB的上下文内存。
这种方法为每个GPU提供了额外的16 TB内存(,原本只有大约1 TB),同时保持200 Gbps的带宽而不牺牲速度。专为生成式AI设计的Spectrum-X网络,确保这些散布在数千GPU中的“便签”作为一个统一的内存系统高效运行。
黄仁勋估算,Spectrum-X可以将吞吐量提升25%,相当于在同等规模的数据中心节省50亿美元。“几乎是免费的,”他总结道。
每层加密保障安全
所有传输、存储和计算中的数据都经过加密,包括PCIe总线、NVLink通信和CPU-GPU传输。企业可以在外部系统部署模型,无需担心数据泄露。
向物理AI和智能代理的转变
在Vera Rubin提供强大算力的同时,NVIDIA宣布了更深层次的范式转变:智能代理和物理AI的时代已经到来。
黄仁勋特别呼吁开源社区,强调去年DeepSeek V1作为首个开源推理系统震惊了世界,引发了一波创新浪潮。他提到Kimi K2和DeepSeek V3.2在开源领域的领导地位,证明NVIDIA现在是在构建这个生态系统,而不是与之竞争。
其战略不仅仅是销售“铲子”。NVIDIA开发了价值数十亿美元的超级计算机DGX Cloud(,以及蛋白质合成模型)“蛋白质”(和OpenFold 3。其开源家族Nemotron包括语音、多模态、增强检索和安全模型。
Alpamayo:具备推理能力的自动驾驶
此次展会的真正惊喜是Alpamayo,这是全球首个具有思考和推理能力的自动驾驶系统。不同于基于规则的自动驾驶,Alpamayo像人类司机一样推理,将复杂场景拆解为常识元素。
“它会告诉你下一步会做什么,以及为什么做出这个决定,”黄仁勋解释道。搭载该技术的梅赛德斯CLA将在2026年第一季度在美国推出,被NCAP评为全球最安全的汽车,得益于NVIDIA开发的“双重安全堆叠”架构。
机器人、工厂与物理AI的未来
NVIDIA提出了全面的机器人战略。所有机器人都将配备Jetson迷你计算机,并在Omniverse平台的Isaac模拟器中进行训练。目标明确:芯片设计、系统架构和工厂仿真,全部由物理AI加速。
黄仁勋邀请波士顿动力和Aility的 humanoid 和四足机器人登台,强调工厂本身就是最大的机器人。甚至迪士尼的机器人也在电脑上训练并在模拟中验证,然后再面对现实世界的重力。
背后的信息
在对“AI泡沫”的怀疑日益增长、摩尔定律的限制变得明显的背景下,黄仁勋需要用具体事实证明AI的潜力。
过去,NVIDIA制造虚拟世界的芯片。现在,他们自己展示了物理AI——以自动驾驶和 humanoid 机器人的形式,正逐步走入现实世界。正如他说的,当战斗开始时,“军事工业”的生意也能真正繁荣。