Vera Rubin: Transformasi diam-diam yang sedang dipersiapkan NVIDIA untuk 2026

Dalam sebuah langkah yang menandai pergeseran signifikan dalam strateginya, NVIDIA memilih untuk tidak memperkenalkan kartu grafis konsumen di CES 2026. Sebagai gantinya, Jensen Huang naik ke panggung dengan sesuatu yang jauh lebih ambisius: sebuah platform komputasi seberat 2,5 ton yang menjanjikan untuk mendefinisikan ulang pelatihan dan inferensi model kecerdasan buatan.

Ketika desain chip melanggar aturan sendiri

Kejutan sejati bukan terletak pada ukuran rangka, melainkan pada komposisi internalnya. Platform Vera Rubin (diberi nama demikian sebagai penghormatan kepada astronom yang menemukan materi gelap) melanggar sebuah aturan internal yang telah dipertahankan NVIDIA selama bertahun-tahun: setiap generasi produk hanya merancang ulang 1-2 chip maksimal.

Kali ini, perusahaan merancang ulang secara bersamaan 6 chip berbeda, menyelesaikan siklus pengembangan dan langsung masuk ke produksi massal. Alasannya pragmatis: Hukum Moore melambat, tetapi model AI tetap menuntut pertumbuhan kinerja tahunan sebesar 10 kali lipat. Satu-satunya solusi adalah berinovasi tidak hanya pada satu komponen, tetapi seluruh arsitektur.

Enam pilar Vera Rubin

Vera CPU: Inti komputasi dengan 88 inti Olympus yang dikustomisasi, mampu memproses 176 thread secara bersamaan. Memori sistem mencapai 1,5 TB, tiga kali lipat dari pendahulunya Grace, dengan bandwidth NVLink C2C sebesar 1,8 TB/s.

Rubin GPU: Mesin inferensi sejati. Menawarkan kekuatan NVFP4 sebesar 50 PFLOPS, lima kali lebih tinggi dari arsitektur Blackwell sebelumnya. Dengan 336 miliar transistor, mengintegrasikan generasi ketiga mesin Transformer, memungkinkan penyesuaian presisi secara dinamis sesuai setiap model.

Konektivitas dan penyimpanan: ConnectX-9 menyediakan Ethernet 800 Gb/s. Prosesor BlueField-4 DPU mengelola generasi baru penyimpanan untuk AI, menggabungkan CPU Grace dengan 64 inti dan kapasitas 800 Gb/s.

Infrastruktur komunikasi: Chip switch NVLink-6 menghubungkan 18 node komputasi, memungkinkan hingga 72 GPU Rubin berfungsi sebagai satu sistem dengan bandwidth all-to-all sebesar 3,6 TB/s. Spectrum-6 menambahkan 512 saluran optik 200 Gbps masing-masing, berkat integrasi silikon fotonik dari TSMC COOP.

Dampak dalam angka: ketika investasi berlipat ganda

Sistem NVL72 dari Vera Rubin mencapai 3,6 EFLOPS dalam tugas inferensi NVFP4, lima kali lebih tinggi dari Blackwell. Dalam pelatihan, mencapai 2,5 EFLOPS, peningkatan 3,5 kali lipat. Tapi yang paling dramatis adalah memorinya: 54 TB LPDDR5X (tiga kali lipat) dan 20,7 TB HBM (1,5 kali lebih besar).

Untuk pusat data 1 GW yang biaya operasionalnya mencapai 50 miliar dolar, ini bukan hanya peningkatan teknis. Artinya throughput token AI yang dihasilkan per watt dan dolar meningkat 10 kali lipat, secara langsung menggandakan kapasitas pendapatan infrastruktur.

Melatih model dengan 10 triliun parameter sekarang hanya membutuhkan seperempat dari sistem Blackwell sebelumnya. Biaya per token yang dihasilkan turun menjadi sekitar sepersepuluh dari sebelumnya.

Mengatasi bottleneck: memori konteks

Selama berbulan-bulan, industri AI menghadapi masalah yang semakin memburuk: “KV Cache” atau memori kerja yang dihasilkan model cepat habis dalam percakapan panjang. Vera Rubin menyelesaikan ini dengan menempatkan prosesor BlueField-4 di dalam rangka, masing-masing dengan 150 TB memori konteks.

Pendekatan ini memberikan setiap GPU tambahan 16 TB memori (ketika awalnya hanya memiliki ~1 TB), menjaga bandwidth 200 Gbps tanpa mengorbankan kecepatan. Jaringan Spectrum-X, yang dirancang khusus untuk AI generatif, memastikan bahwa “catatan tempel” yang tersebar di ribuan GPU ini berfungsi sebagai satu memori yang kohesif.

Jensen Huang memperkirakan Spectrum-X dapat meningkatkan throughput sebesar 25%, setara menghemat 5 miliar dolar di pusat data sebesar itu. “Hampir gratis,” simpulnya.

Keamanan terenkripsi di setiap lapisan

Semua data dalam transit, penyimpanan, dan perhitungan dienkripsi, termasuk bus PCIe, komunikasi NVLink, dan transfer CPU-GPU. Perusahaan dapat menempatkan model di sistem eksternal tanpa takut kebocoran data.

Peralihan ke AI fisik dan kecerdasan agen

Sementara Vera Rubin menyediakan kekuatan mentah, NVIDIA mengumumkan perubahan paradigma yang lebih mendalam: era “agen cerdas” dan AI fisik telah tiba.

Jensen Huang melakukan panggilan khusus kepada komunitas open source, menyoroti bagaimana DeepSeek V1 mengejutkan dunia tahun lalu sebagai sistem inferensi open source pertama, memicu gelombang inovasi. Ia mengakui Kimi K2 dan DeepSeek V3.2 sebagai pemimpin di ruang open source, menunjukkan bahwa NVIDIA kini membangun di atas ekosistem ini daripada bersaing melawannya.

Strateginya bukan hanya menjual sekop. NVIDIA mengembangkan superkomputer DGX Cloud (dihargai miliaran) dan model mutakhir seperti synthesia protein (Protein) dan OpenFold 3. Keluarga open source Nemotron mencakup model suara, multimodal, pemulihan yang ditingkatkan, dan keamanan.

Alpamayo: pengemudian otonom dengan penalaran

Yang benar-benar mengejutkan dari acara ini adalah Alpamayo, sistem pengemudian otonom pertama di dunia dengan kemampuan berpikir dan penalaran. Berbeda dari pengemudian otonom berbasis aturan, Alpamayo bernalar seperti pengemudi manusia, memecah skenario kompleks menjadi elemen logika umum.

“Ini akan memberi tahu apa yang akan dilakukan selanjutnya dan mengapa dia memutuskan demikian,” jelas Jensen Huang. Mercedes CLA dengan teknologi ini akan diluncurkan di AS pada kuartal pertama 2026, dinilai sebagai mobil paling aman di dunia oleh NCAP, berkat arsitektur “ganda lapisan keamanan” yang dikembangkan NVIDIA.

Robot, pabrik, dan masa depan AI fisik

NVIDIA memperkenalkan strategi robotik yang komprehensif. Semua robot akan dilengkapi dengan komputer mini Jetson dan dilatih di simulator Isaac dari platform Omniverse. Visinya jelas: desain chip, arsitektur sistem, dan simulasi pabrik, semuanya dipercepat oleh AI fisik.

Jensen Huang mengundang robot humanoid dan berkaki empat dari Boston Dynamics dan Agility ke panggung, menekankan bahwa pabrik itu sendiri adalah robot terbesar. Bahkan robot Disney dilatih di komputer dan divalidasi dalam simulasi sebelum menghadapi gravitasi di dunia nyata.

Pesan inti

Dalam konteks di mana skeptisisme terhadap “gelembung AI” meningkat dan batas Hukum Moore menjadi jelas, Jensen Huang perlu membuktikan dengan fakta konkret apa yang dapat dicapai AI.

Dulu, NVIDIA membuat chip untuk dunia virtual. Sekarang, mereka sendiri menunjukkan bagaimana AI fisik—dalam bentuk pengemudian otonom dan robot humanoid—mulai memasuki dunia nyata. Seperti yang dia katakan, ketika pertempuran dimulai, bisnis “industri militer” benar-benar dapat berkembang.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)