2026-01-17 03:34:05

Під час виставки CES новий архітектурний підхід Rubin від NVIDIA став головною темою обговорень на ринку, крім MOE архітектури — ще одним значним проривом, і тим, що створено для епохи Agentic AI. Я детально вивчив цю тему і справді відчув, що старий Хуан (Гордон Мур) знову демонструє «самореволюцію»:

1) Раніше NVIDIA залежала від переваги у GPU-апаратурі, скориставшись бенефітами буму, коли всі великі гіганти AI активно закуповували обчислювальні ресурси для тренування великих моделей. Логіка була проста: чим більше у тебе відеокарт, тим краще ти можеш тренувати моделі.

Але тепер війна в AI перейшла з «обчислювальної потужності» у «логіку», особливо з приходом епохи Agentic AI, коли потрібно обробляти високочастотні, багатоступінчасті та дуже довгі контексти.

У цей час параметри моделей досягають трильйонів, обсяг даних — величезний, і навіть якщо GPU працює швидко, якщо передача даних у пам’ять недостатньо швидка, GPU просто буде простоювати. Це і є «стена пам’яті» — іншими словами, додавання більше відеокарт уже не вирішує проблему, потрібна висока відеопам’ять і пропускна здатність. Rubin має вирішити саме цю проблему.

2) Тому HBM4, вперше представлений Rubin, — це четверте покоління високопродуктивної пам’яті з пропускною здатністю до 22TB/с. Але ще важливіше те, що він працює у парі з технологією NVLink 6 (з пропускною здатністю в межах 260TB/с у межах системи), що робить 72 карти логічно «одним великим чіпом».

Що це означає? Раніше ви купували відеокарту — окремий компонент, і передача даних між картами була схожа на доставку через кілька перевалочних пунктів. Тепер Rubin за допомогою високої щільності з’єднань дозволяє даним майже не відчувати фізичної відстані між GPU, і 72 карти працюють як один «мозок».

Я вважаю, що це і є справжній козир Rubin: не просто додавання апаратних параметрів, а перебудова потоків даних у системі.

3) Якщо MOE (гібридна архітектура експертів) була ударом для NVIDIA у відповідь на натиск нових гравців, таких як DeepSeek, які «жорстко» навантажують бізнес-модель з масовим використанням карт, то Rubin — це стратегічна контратака від старого Хуана. Це не змагання за менше споживання карт, а повна перебудова вартості використання AI. Звісно, цей хід означає, що NVIDIA повністю прощається з старою моделлю «жорсткого» масового використання карт.

З іншого боку, старий Хуан розраховує на інший аспект: для реального впровадження Agentic AI у різні галузі потрібно подолати ціну токенів — це тенденція, яку NVIDIA не може зупинити.

З його точки зору, краще бути тим, хто сам створює прорив, ніж чекати, поки великі гравці, такі як Google або Meta, самі розроблять свої чіпи і з’їдять ринок, або ж — щоб DeepSeek і подібні компанії зруйнували ринок за допомогою нових моделей.

4) Питання: як тепер NVIDIA, після самореволюції, буде діяти? Шлях цілком ясний: від «продажу відеокарт» до «продажу систем», від обслуговування кількох великих компаній до поширення AI серед широкого кола користувачів.

Раніше, купуючи H100, NVIDIA заробляла на самих відеокартах. Тепер Rubin повідомить вам: потрібно купити повний комплект NVL72 — 72 GPU, NVLink Switch, систему з рідинним охолодженням, серверний корпус і навіть програмне забезпечення — все у пакеті.

Загалом, старий Хуан розраховує, що, хоча вартість комплекту може зростати, додана ефективність логіки і обчислень знизить ціну за одиницю AI-обчислень для користувачів, і при цьому він не втратить частку ринку.

Але ж, ця стратегія ускладнює вхід для середніх і малих гравців. Тільки великі компанії і хмарні провайдери зможуть її реалізувати, що ще більше посилить монополію у обчислювальних ресурсах. У нинішніх умовах це — ризикована ставка, адже якщо HBM4 матиме проблеми з масовим виробництвом, її можуть замінити альтернативи від AMD, Google TPU та інших. І тоді мрія NVIDIA про системи може виявитися набагато складнішою для реалізації.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.