Vera Rubin: NVIDIAが2026年に向けて準備している静かな変革

NVIDIAは、その戦略において大きな転換を示す動きとして、CES 2026でコンシューマー向けグラフィックスカードの発表を見送ることを選択しました。その代わりに、ジェンセン・ファンははるかに野心的なものを披露しました:2.5トンの計算プラットフォームで、AIモデルのトレーニングと推論を再定義することを約束しています。

チップ設計が自らのルールを破るとき

真の驚きは、フレームのサイズではなく、その内部構成にあります。Vera Rubinプラットフォーム(は、暗黒物質を発見した天文学者にちなんで名付けられました)。これは、NVIDIAが長年守ってきた内部ルールを破るもので、各世代の製品は最大でも1-2個のチップのみを再設計するというものでした。

今回は、同時に6つの異なるチップを再設計し、開発サイクルを完了させ、直接大量生産に入ることに成功しました。その理由は実用的です:ムーアの法則は鈍化していますが、AIモデルは依然として年間10倍の性能向上を要求し続けています。唯一の解決策は、コンポーネント単位ではなく、アーキテクチャ全体を革新することでした。

Vera Rubinの六つの柱

Vera CPU: 88コアのオリンパスカスタムプロセッサを備え、同時に176スレッドを処理可能な計算コア。システムメモリは1.5TBに達し、前世代のGraceの3倍、NVLink C2Cの帯域幅は1.8TB/s。

Rubin GPU: 推論の真のエンジン。50 PFLOPSのNVFP4性能を提供し、前世代のBlackwellアーキテクチャの5倍の性能。3360億個のトランジスタを搭載し、第3世代のTransformerエンジンを組み込み、モデルに応じて動的に精度を調整可能。

接続性とストレージ: ConnectX-9は800 Gb/sのイーサネットを提供。BlueField-4 DPUは、新世代のAI用ストレージを管理し、64コアのGrace CPUと800 Gb/sの能力を融合。

通信インフラ: NVLink-6スイッチチップは18ノードの計算ノードを接続し、最大72GPUのRubinを1つのシステムとして動作させ、3.6TB/sの全-to-全帯域を実現。Spectrum-6は200 Gbpsの光チャネル512本を追加し、TSMC COOPのシリコンフォトニクスを統合。

数字で見るインパクト:投資が倍増するとき

Vera RubinのシステムNVL72は、推論タスクで3.6 EFLOPSのNVFP4性能を達成し、Blackwellの5倍。トレーニングでは2.5 EFLOPSに到達し、3.5倍の向上。最大の変化はメモリ容量にあり、54 TBのLPDDR5X(は3倍、20.7 TBのHBM)は1.5倍増加。

1000 MWのデータセンターのコストは500億ドルですが、これは単なる技術的改善ではありません。IA生成トークンのスループットがワットとドルあたりで10倍向上し、インフラの収益能力を直接2倍にします。

10兆パラメータのモデルのトレーニングには、以前のBlackwellシステムの4分の1のシステムだけで済むようになりました。生成されるトークンあたりのコストも約10分の1に低下。

ボトルネックの解消:コンテキストメモリ

数ヶ月にわたり、AI業界は拡大する問題に直面してきました:長い会話でモデルが生成する「KVキャッシュ」や作業メモリがすぐに枯渇するのです。Vera Rubinは、BlueField-4プロセッサをフレーム内に展開し、各に150 TBのコンテキストメモリを搭載することで解決します。

このアプローチにより、各GPUに16 TBの追加メモリ(が提供され、もともと約1 TBしか持たなかったものを補完しつつ、200 Gbpsの帯域幅を維持。AI生成に特化したSpectrum-Xネットワークは、何千ものGPUに散在するこれらの「付箋」のようなメモリを一つの一貫したメモリとして機能させます。

ジェンセン・ファンは、Spectrum-Xがスループットを25%向上させ、同規模のデータセンターで50億ドルの節約に相当すると計算しました。「ほぼ無料です」と要約。

各層の暗号化セキュリティ

トランジット中のすべてのデータ、ストレージ、計算は暗号化されており、PCIeバス、NVLink通信、CPU-GPU間の転送も含まれます。企業は外部システムにモデルを展開しても、データ漏洩の心配はありません。

物理的AIとエージェントの知能への転換

Vera Rubinが生の計算能力を提供する一方で、NVIDIAはより深いパラダイムシフトを発表しました:それは「インテリジェントエージェント」と物理的AIの時代です。

ジェンセン・ファンは、オープンソースコミュニティに特別な呼びかけを行い、DeepSeek V1が昨年、最初のオープンソース推論システムとして世界を驚かせ、革新の波を引き起こしたことを強調しました。Kimi K2やDeepSeek V3.2をオープンソースのリーダーと認め、NVIDIAがこのエコシステムの上に構築し、競合するのではなく共存していることを示しました。

戦略は単にパドルを売ることだけではありません。NVIDIAは、数十億ドル規模のスーパーコンピュータDGX Cloud)や、タンパク質の合成モデル「シンセシア」(The Protein)、OpenFold 3などの最先端モデルを開発しています。オープンソースのNemotronファミリーには、音声、マルチモーダル、拡張リトリーバル、安全性のモデルも含まれます。

アルパマヨ:推論を伴う自律走行

イベントの真の目玉は、アルパマヨでした。これは、思考と推論の能力を持つ世界初の自律走行システムです。ルールに基づく自律走行とは異なり、アルパマヨは人間の運転手のように推論し、複雑なシナリオを常識的な要素に分解します。

「次に何をするか、なぜそう決めたのかを教えてくれる」とジェンセン・ファンは説明しました。この技術を搭載したメルセデスCLAは、2026年第1四半期に米国で発売され、NCAPによって世界最も安全な車と評価されました。これは、NVIDIAが開発した「二重安全ピラーメカニズム」のアーキテクチャによるものです。

ロボット、工場、そして物理的AIの未来

NVIDIAは、ロボティクスの包括的戦略を発表しました。すべてのロボットはJetsonミニコンピュータを搭載し、OmniverseプラットフォームのIsaacシミュレーターで訓練されます。ビジョンは明確です:チップ設計、システムアーキテクチャ、工場のシミュレーションをすべて、物理的AIによって加速させること。

ジェンセン・ファンは、ボストンダイナミクスやアジリティのヒューマノイドおよび四足歩行ロボットをステージに招き、「工場自体が最大のロボットだ」と強調しました。ディズニーのロボットも、実際の重力に挑む前にコンピュータ上で訓練と検証を済ませています。

背後のメッセージ

「AIバブル」への懐疑やムーアの法則の限界が明らかになる中、ジェンセン・ファンは具体的な事実をもって、AIが何を成し得るかを示す必要がありました。

以前は、NVIDIAは仮想世界向けのチップを作っていました。今や、彼ら自身が、物理的なAI—自動運転やヒューマノイドロボットの形で—が現実の世界に入りつつあることを証明しています。彼は言いました、戦いが始まるとき、「軍事産業」のビジネスは本当に繁栄できると。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン