Vera Rubin: Cuộc chuyển đổi âm thầm mà NVIDIA đang chuẩn bị cho năm 2026

Trong một bước đi đánh dấu sự thay đổi đáng kể trong chiến lược của mình, NVIDIA đã quyết định không trình làng card đồ họa tiêu dùng tại CES 2026. Thay vào đó, Jensen Huang đã bước lên sân khấu với một dự án còn tham vọng hơn nhiều: một nền tảng tính toán nặng 2.5 tấn hứa hẹn định hình lại quá trình huấn luyện và suy luận của các mô hình trí tuệ nhân tạo.

Khi thiết kế chip phá vỡ chính quy của chính nó

Thật sự bất ngờ không nằm ở kích thước của khung máy, mà ở thành phần bên trong. Nền tảng Vera Rubin (được đặt tên theo nhà thiên văn học phát hiện ra vật chất tối) đã phá vỡ một quy tắc nội bộ mà NVIDIA đã duy trì trong nhiều năm: mỗi thế hệ sản phẩm chỉ thiết kế lại tối đa 1-2 chip.

Lần này, công ty đã thiết kế lại đồng thời 6 chip khác nhau, hoàn thành vòng đời phát triển và bước thẳng vào sản xuất hàng loạt. Lý do là thực dụng: Luật Moore đang chậm lại, nhưng các mô hình AI vẫn yêu cầu tăng trưởng hiệu suất hàng năm gấp 10 lần. Giải pháp duy nhất là đổi mới không chỉ ở một thành phần, mà toàn bộ kiến trúc.

Sáu trụ cột của Vera Rubin

Vera CPU: Trái tim tính toán với 88 lõi Olympus tùy chỉnh, có khả năng xử lý đồng thời 176 luồng. Bộ nhớ hệ thống đạt 1.5 TB, gấp ba lần người tiền nhiệm Grace, với băng thông NVLink C2C 1.8 TB/s.

Rubin GPU: Động cơ suy luận thực sự. Cung cấp công suất NVFP4 50 PFLOPS, gấp năm lần kiến trúc Blackwell trước đó. Với 336 tỷ transistor, tích hợp thế hệ thứ ba của các động cơ Transformer, cho phép điều chỉnh độ chính xác linh hoạt theo từng mô hình.

Kết nối và lưu trữ: ConnectX-9 cung cấp Ethernet 800 Gb/s. Bộ xử lý BlueField-4 DPU quản lý thế hệ mới của lưu trữ cho AI, kết hợp CPU Grace 64 lõi với khả năng 800 Gb/s.

Hạ tầng truyền thông: Chip chuyển mạch NVLink-6 kết nối 18 nút tính toán, cho phép tới 72 GPU Rubin hoạt động như một hệ thống duy nhất với băng thông 3.6 TB/s all-to-all. Spectrum-6 bổ sung 512 kênh quang 200 Gbps mỗi kênh, nhờ tích hợp silicon quang học của TSMC COOP.

Tác động về mặt số liệu: khi đầu tư nhân lên gấp nhiều lần

Hệ thống NVL72 của Vera Rubin đạt 3.6 EFLOPS trong các nhiệm vụ suy luận NVFP4, gấp năm lần Blackwell. Trong huấn luyện, đạt 2.5 EFLOPS, tăng 3.5 lần. Nhưng điều đáng chú ý nhất là bộ nhớ: 54 TB LPDDR5X (gấp ba) và 20.7 TB HBM (gấp 1.5 lần).

Đối với trung tâm dữ liệu 1 GW có chi phí 50 tỷ đô la, điều này không chỉ là một cải tiến kỹ thuật. Nó còn có nghĩa là throughput các token AI sinh ra trên mỗi watt và đô la tăng gấp 10 lần, trực tiếp nhân đôi khả năng doanh thu của hạ tầng.

Huấn luyện một mô hình 10 nghìn tỷ tham số giờ đây chỉ cần 1/4 hệ thống Blackwell trước đó. Chi phí cho mỗi token sinh ra giảm xuống khoảng 1/10 so với trước.

Giải quyết nút thắt cổ chai: bộ nhớ ngữ cảnh

Trong nhiều tháng, ngành công nghiệp AI đã đối mặt với một vấn đề ngày càng tăng: “KV Cache” hay bộ nhớ làm việc mà các mô hình tạo ra bị cạn kiệt nhanh chóng trong các cuộc trò chuyện dài. Vera Rubin giải quyết bằng cách triển khai các bộ xử lý BlueField-4 trong khung máy, mỗi bộ có 150 TB bộ nhớ ngữ cảnh.

Cách tiếp cận này cung cấp cho mỗi GPU thêm 16 TB bộ nhớ (khi ban đầu chỉ có khoảng 1 TB), duy trì băng thông 200 Gbps mà không giảm tốc độ. Mạng Spectrum-X, được thiết kế đặc biệt cho AI tạo sinh, đảm bảo rằng các “ghi chú dán” phân tán trên hàng nghìn GPU hoạt động như một bộ nhớ nhất quán duy nhất.

Jensen Huang tính toán rằng Spectrum-X có thể tăng throughput lên 25%, tương đương tiết kiệm 5 tỷ đô la trong một trung tâm dữ liệu quy mô đó. “Gần như miễn phí”, ông tóm tắt.

An ninh mã hóa ở mọi lớp

Tất cả dữ liệu trong quá trình truyền, lưu trữ và tính toán đều được mã hóa, bao gồm bus PCIe, truyền thông NVLink và chuyển đổi CPU-GPU. Các công ty có thể triển khai các mô hình trên hệ thống bên ngoài mà không lo rò rỉ dữ liệu.

Chuyển hướng sang AI vật lý và trí tuệ của các tác nhân

Trong khi Vera Rubin cung cấp sức mạnh thô, NVIDIA đã công bố một bước ngoặt sâu hơn: kỷ nguyên của “các tác nhân thông minh” và AI vật lý đã đến.

Jensen Huang đã kêu gọi cộng đồng mã nguồn mở, nhấn mạnh cách DeepSeek V1 đã gây bất ngờ cho thế giới năm ngoái như hệ thống suy luận mã nguồn mở đầu tiên, mở ra làn sóng đổi mới. Ông công nhận Kimi K2 và DeepSeek V3.2 là những người dẫn đầu trong lĩnh vực mã nguồn mở, chứng minh rằng NVIDIA giờ đây xây dựng dựa trên hệ sinh thái này thay vì cạnh tranh với nó.

Chiến lược không chỉ là bán các công cụ. NVIDIA đã phát triển siêu máy tính DGX Cloud (được định giá hàng tỷ đô la) và các mô hình tiên tiến như synthesia protein (Protein) và OpenFold 3. Gia đình mã nguồn mở Nemotron của họ bao gồm các mô hình giọng nói, đa chế độ, phục hồi tăng cường và an ninh.

Alpamayo: lái xe tự hành có khả năng suy nghĩ

Điều gây ngạc nhiên thực sự của sự kiện là Alpamayo, hệ thống lái xe tự hành đầu tiên trên thế giới có khả năng tư duy và lý luận. Khác với lái xe tự hành dựa trên quy tắc, Alpamayo suy luận như một người lái xe con người, phân tích các tình huống phức tạp thành các yếu tố hợp lý.

“Nó sẽ nói cho bạn biết điều gì sẽ xảy ra tiếp theo và tại sao nó quyết định như vậy”, Jensen Huang giải thích. Mercedes CLA với công nghệ này sẽ ra mắt tại Mỹ trong quý đầu năm 2026, được xếp hạng là xe an toàn nhất thế giới bởi NCAP, nhờ kiến trúc “dưới hai lớp an toàn” mà NVIDIA đã phát triển.

Robot, nhà máy và tương lai của AI vật lý

NVIDIA giới thiệu chiến lược toàn diện về robot. Tất cả robot sẽ được trang bị máy tính mini Jetson và huấn luyện trong mô phỏng Isaac của nền tảng Omniverse. Tầm nhìn rõ ràng: thiết kế chip, kiến trúc hệ thống và mô phỏng nhà máy, tất cả đều được tăng tốc bởi AI vật lý.

Jensen Huang đã mời các robot hình người và bốn chân của Boston Dynamics và Agility lên sân khấu, nhấn mạnh rằng chính nhà máy là robot lớn nhất. Thậm chí các robot của Disney cũng đã được huấn luyện trên máy tính và xác nhận trong mô phỏng trước khi đối mặt với trọng lực trong thế giới thực.

Thông điệp nền tảng

Trong bối cảnh ngày càng có nhiều hoài nghi về “bong bóng AI” và giới hạn của Luật Moore trở nên rõ ràng, Jensen Huang cần chứng minh bằng các bằng chứng cụ thể những gì AI có thể đạt được.

Trước đây, NVIDIA làm chip cho thế giới ảo. Giờ đây, chính họ thể hiện cách AI vật lý—dưới dạng lái xe tự hành và robot hình người—đang bước vào thế giới thực. Như ông đã nói, khi cuộc chiến bắt đầu, ngành công nghiệp “quân sự” thực sự có thể thịnh vượng.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim