Віра Рубін: Тихий перетворення, яке NVIDIA готує на 2026 рік

У руху, що знаменує собою значний поворот у їхній стратегії, NVIDIA вирішила не представляти споживчі графічні карти на CES 2026. Замість цього, Дженсен Хуанг піднявся на сцену з чимось набагато більш амбітним: платформою обчислень вагою 2,5 тонни, яка обіцяє переосмислити тренування та інференцію моделей штучного інтелекту.

Коли дизайн чипів порушує власні правила

Справжній сюрприз полягає не у розмірі рами, а у її внутрішньому складі. Платформа Vera Rubin (названа так на честь астрономки, яка відкрила темну матерію) порушила внутрішню правило, яке NVIDIA дотримувалася роками: кожне покоління продуктів переосмислює лише 1-2 чипи максимум.

Цього разу компанія одночасно перепроектувала 6 різних чипів, завершивши цикл розробки та перейшовши безпосередньо до масового виробництва. Причина прагматична: Закон Мура сповільнюється, але моделі ШІ все ще вимагають щорічного зростання продуктивності у 10 разів. Єдине рішення — інновації не в одному компоненті, а у всій архітектурі.

Шість опор Vera Rubin

Vera CPU: Обчислювальне ядро з 88 персоналізованими ядрами Olympus, здатне обробляти 176 потоків одночасно. Його системна пам’ять досягає 1,5 ТБ, у три рази більше, ніж у попередниці Grace, з пропускною здатністю NVLink C2C 1,8 ТБ/с.

Rubin GPU: Справжній двигун інференції. Забезпечує потужність NVFP4 50 PFLOPS, у п’ять разів вищу за архітектуру Blackwell. З 336 мільярдами транзисторів, він включає третє покоління трансформерних двигунів, що дозволяє динамічно налаштовувати точність залежно від моделі.

Зв’язок і зберігання: ConnectX-9 забезпечує Ethernet 800 Гбіт/с. Процесор BlueField-4 DPU керує новим поколінням зберігання для ШІ, поєднуючи CPU Grace з пропускною здатністю 800 Гбіт/с.

Інфраструктура зв’язку: Чип-комутатор NVLink-6 з’єднує 18 обчислювальних вузлів, дозволяючи до 72 GPU Rubin працювати як єдина система з пропускною здатністю 3,6 ТБ/с у всіх напрямках. Spectrum-6 додає 512 оптичних каналів по 200 Гбіт/с кожен, завдяки інтеграції фотонного силікону TSMC COOP.

Вплив у цифрах: коли інвестиції множаться

Система NVL72 Vera Rubin досягає 3,6 EFLOPS у задачах інференції NVFP4, у п’ять разів більше, ніж Blackwell. У тренуванні — 2,5 EFLOPS, зростання у 3,5 рази. Але найвражаюче — пам’ять: 54 ТБ LPDDR5X (у три рази більше) та 20,7 ТБ HBM (1,5 рази більше).

Для дата-центру потужністю 1 ГВт, що коштує 50 мільярдів доларів, це не просто технічне покращення. Це означає, що пропускна здатність у токенах ШІ, що генеруються на ват і долар, зростає у 10 разів, безпосередньо подвоюючи доходи інфраструктури.

Тренування моделі з 10 трильйонами параметрів тепер вимагає лише 1/4 попередніх систем Blackwell. Вартість за згенерований токен знижується приблизно до 1/10 попередньої.

Вирішення вузького місця: пам’ять контексту

Протягом місяців індустрія ШІ стикалася з зростаючою проблемою: “KV Cache” або робоча пам’ять, яку генерують моделі, швидко вичерпується у довгих розмовах. Vera Rubin вирішує цю проблему, розгортаючи процесори BlueField-4 у рамі, кожен з яких має 150 ТБ пам’яті контексту.

Цей підхід забезпечує кожній GPU додаткові 16 ТБ пам’яті (коли спочатку доступно лише ~1 ТБ), зберігаючи пропускну здатність 200 Гбіт/с без зниження швидкості. Мережа Spectrum-X, спеціально розроблена для генеративного ШІ, гарантує, що ці “клейкі” нотатки, розкидані по тисячах GPU, працюють як єдина когерентна пам’ять.

Дженсен Хуанг підрахував, що Spectrum-X може підвищити пропускну здатність на 25%, що еквівалентно економії 5 мільярдів доларів у дата-центрі такої масштабності. “Практично безкоштовно”, підсумував він.

Шифрована безпека на кожному рівні

Усі дані у транзиті, зберіганні та обчисленнях зашифровані, включаючи шини PCIe, комунікацію NVLink і передачі CPU-GPU. Компанії можуть розгортати моделі у зовнішніх системах без страху витоку даних.

Зміна парадигми: фізичний ШІ та інтелект агентів

Поки Vera Rubin забезпечує грубу силу, NVIDIA оголосила про глибший зсув парадигми: ера “розумних агентів” і фізичного ШІ вже тут.

Дженсен Хуанг зробив особливий заклик до спільноти з відкритим кодом, підкреслюючи, як DeepSeek V1 здивував світ минулого року як перша система інференції з відкритим кодом, спричинивши хвилю інновацій. Він визнав Kimi K2 і DeepSeek V3.2 лідерами у просторі з відкритим кодом, демонструючи, що NVIDIA тепер будує на цій екосистемі, а не конкурує з нею.

Стратегія полягає не лише у продажу лопат. NVIDIA розробила суперкомп’ютер DGX Cloud (вартістю у мільярди) та передові моделі, такі як synthesia білків (The Protein) і OpenFold 3. Її сімейство з відкритим кодом Nemotron включає моделі голосу, мультимодальні, розширене відновлення та безпеку.

Alpamayo: автономне керування з мисленням

Найбільш вражаючим на заході став Alpamayo — перша у світі система автономного керування з можливостями мислення та розуміння. На відміну від керування на основі правил, Alpamayo розмірковує як людський водій, розбиваючи складні сценарії на елементи здорового глузду.

“Він скаже, що зробить далі і чому він так вирішив”, пояснив Дженсен Хуанг. Mercedes CLA з цією технологією буде запущений у США у першому кварталі 2026 року і вважається найбезпечнішим автомобілем у світі за версією NCAP, завдяки архітектурі “подвійної системи безпеки”, яку розробила NVIDIA.

Роботи, фабрики та майбутнє фізичного ШІ

NVIDIA представила цілісну стратегію робототехніки. Усі роботи будуть обладнані міні-комп’ютером Jetson і тренуватимуться у симуляторі Isaac платформи Omniverse. Ясна мета: дизайн чипів, архітектура систем і моделювання фабрик — все прискорене фізичним ШІ.

Дженсен Хуанг запросив на сцену гуманоїдних і квадрупедних роботів Boston Dynamics та Agility, підкреслюючи, що сама фабрика — найбільший робот. Навіть роботи Disney тренувалися на комп’ютерах і проходили валідацію у симуляціях перед тим, як зіткнутися з гравітацією у реальному світі.

Основне послання

У контексті зростаючого скептицизму щодо “бульбашки ШІ” і очевидних обмежень Закону Мура, Дженсен Хуанг мав продемонструвати конкретними фактами, що може досягти ШІ.

Раніше NVIDIA створювала чипи для віртуального світу. Тепер вони самі демонструють, як фізичний ШІ — у формі автономного керування та гуманоїдних роботів — входить у реальний світ. Як він сказав, коли починається битва, бізнес “військової промисловості” може справді процвітати.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити