Vera Rubin: NVIDIAが2026年に向けて準備している静かな変革

WalletsWatcher · 2026-01-15T14:07:46+00:00

戦略において重要な転換を示す動きの中で、NVIDIAはCES 2026でコンシューマー向けのグラフィックスカードを発表しないことを選択しました。その代わりに、Jensen Huangははるかに野心的なものを携えてステージに登壇しました：2.5トンの計算プラットフォームであり、これがを再定義すると約束しています。

WalletsWatcher

2026-01-15 14:07:46

NVIDIAは、その戦略において大きな転換を示す動きとして、CES 2026でコンシューマー向けグラフィックスカードの発表を見送ることを選択しました。その代わりに、ジェンセン・ファンははるかに野心的なものを披露しました：2.5トンの計算プラットフォームで、AIモデルのトレーニングと推論を再定義することを約束しています。

チップ設計が自らのルールを破るとき

真の驚きは、フレームのサイズではなく、その内部構成にあります。Vera Rubinプラットフォーム(は、暗黒物質を発見した天文学者にちなんで名付けられました)。これは、NVIDIAが長年守ってきた内部ルールを破るもので、各世代の製品は最大でも1-2個のチップのみを再設計するというものでした。

今回は、同時に6つの異なるチップを再設計し、開発サイクルを完了させ、直接大量生産に入ることに成功しました。その理由は実用的です：ムーアの法則は鈍化していますが、AIモデルは依然として年間10倍の性能向上を要求し続けています。唯一の解決策は、コンポーネント単位ではなく、アーキテクチャ全体を革新することでした。

Vera Rubinの六つの柱

Vera CPU: 88コアのオリンパスカスタムプロセッサを備え、同時に176スレッドを処理可能な計算コア。システムメモリは1.5TBに達し、前世代のGraceの3倍、NVLink C2Cの帯域幅は1.8TB/s。

Rubin GPU: 推論の真のエンジン。50 PFLOPSのNVFP4性能を提供し、前世代のBlackwellアーキテクチャの5倍の性能。3360億個のトランジスタを搭載し、第3世代のTransformerエンジンを組み込み、モデルに応じて動的に精度を調整可能。

接続性とストレージ: ConnectX-9は800 Gb/sのイーサネットを提供。BlueField-4 DPUは、新世代のAI用ストレージを管理し、64コアのGrace CPUと800 Gb/sの能力を融合。

通信インフラ: NVLink-6スイッチチップは18ノードの計算ノードを接続し、最大72GPUのRubinを1つのシステムとして動作させ、3.6TB/sの全-to-全帯域を実現。Spectrum-6は200 Gbpsの光チャネル512本を追加し、TSMC COOPのシリコンフォトニクスを統合。

数字で見るインパクト：投資が倍増するとき

Vera RubinのシステムNVL72は、推論タスクで3.6 EFLOPSのNVFP4性能を達成し、Blackwellの5倍。トレーニングでは2.5 EFLOPSに到達し、3.5倍の向上。最大の変化はメモリ容量にあり、54 TBのLPDDR5X(は3倍、20.7 TBのHBM)は1.5倍増加。

1000 MWのデータセンターのコストは500億ドルですが、これは単なる技術的改善ではありません。IA生成トークンのスループットがワットとドルあたりで10倍向上し、インフラの収益能力を直接2倍にします。

10兆パラメータのモデルのトレーニングには、以前のBlackwellシステムの4分の1のシステムだけで済むようになりました。生成されるトークンあたりのコストも約10分の1に低下。

ボトルネックの解消：コンテキストメモリ

数ヶ月にわたり、AI業界は拡大する問題に直面してきました：長い会話でモデルが生成する「KVキャッシュ」や作業メモリがすぐに枯渇するのです。Vera Rubinは、BlueField-4プロセッサをフレーム内に展開し、各に150 TBのコンテキストメモリを搭載することで解決します。

このアプローチにより、各GPUに16 TBの追加メモリ(が提供され、もともと約1 TBしか持たなかったものを補完しつつ、200 Gbpsの帯域幅を維持。AI生成に特化したSpectrum-Xネットワークは、何千ものGPUに散在するこれらの「付箋」のようなメモリを一つの一貫したメモリとして機能させます。

ジェンセン・ファンは、Spectrum-Xがスループットを25%向上させ、同規模のデータセンターで50億ドルの節約に相当すると計算しました。「ほぼ無料です」と要約。

各層の暗号化セキュリティ

トランジット中のすべてのデータ、ストレージ、計算は暗号化されており、PCIeバス、NVLink通信、CPU-GPU間の転送も含まれます。企業は外部システムにモデルを展開しても、データ漏洩の心配はありません。

物理的AIとエージェントの知能への転換

Vera Rubinが生の計算能力を提供する一方で、NVIDIAはより深いパラダイムシフトを発表しました：それは「インテリジェントエージェント」と物理的AIの時代です。

ジェンセン・ファンは、オープンソースコミュニティに特別な呼びかけを行い、DeepSeek V1が昨年、最初のオープンソース推論システムとして世界を驚かせ、革新の波を引き起こしたことを強調しました。Kimi K2やDeepSeek V3.2をオープンソースのリーダーと認め、NVIDIAがこのエコシステムの上に構築し、競合するのではなく共存していることを示しました。

戦略は単にパドルを売ることだけではありません。NVIDIAは、数十億ドル規模のスーパーコンピュータDGX Cloud)や、タンパク質の合成モデル「シンセシア」(The Protein)、OpenFold 3などの最先端モデルを開発しています。オープンソースのNemotronファミリーには、音声、マルチモーダル、拡張リトリーバル、安全性のモデルも含まれます。

アルパマヨ：推論を伴う自律走行

イベントの真の目玉は、アルパマヨでした。これは、思考と推論の能力を持つ世界初の自律走行システムです。ルールに基づく自律走行とは異なり、アルパマヨは人間の運転手のように推論し、複雑なシナリオを常識的な要素に分解します。

「次に何をするか、なぜそう決めたのかを教えてくれる」とジェンセン・ファンは説明しました。この技術を搭載したメルセデスCLAは、2026年第1四半期に米国で発売され、NCAPによって世界最も安全な車と評価されました。これは、NVIDIAが開発した「二重安全ピラーメカニズム」のアーキテクチャによるものです。

ロボット、工場、そして物理的AIの未来

NVIDIAは、ロボティクスの包括的戦略を発表しました。すべてのロボットはJetsonミニコンピュータを搭載し、OmniverseプラットフォームのIsaacシミュレーターで訓練されます。ビジョンは明確です：チップ設計、システムアーキテクチャ、工場のシミュレーションをすべて、物理的AIによって加速させること。

ジェンセン・ファンは、ボストンダイナミクスやアジリティのヒューマノイドおよび四足歩行ロボットをステージに招き、「工場自体が最大のロボットだ」と強調しました。ディズニーのロボットも、実際の重力に挑む前にコンピュータ上で訓練と検証を済ませています。