Під час виставки CES новий архітектурний підхід Rubin від NVIDIA став головною темою обговорень на ринку, крім MOE архітектури — ще одним значним проривом, і тим, що створено для епохи Agentic AI. Я детально вивчив цю тему і справді відчув, що старий Хуан (Гордон Мур) знову демонструє «самореволюцію»:
1) Раніше NVIDIA залежала від переваги у GPU-апаратурі, скориставшись бенефітами буму, коли всі великі гіганти AI активно закуповували обчислювальні ресурси для тренування великих моделей. Логіка була проста: чим більше у тебе відеокарт, тим краще ти можеш тренувати моделі.
Але тепер війна в AI перейшла з «обчислювальної потужності» у «логіку», особливо з приходом епохи Agentic AI, коли потрібно обробляти високочастотні, багатоступінчасті та дуже довгі контексти.
У цей час параметри моделей досягають трильйонів, обсяг даних — величезний, і навіть якщо GPU працює швидко, якщо передача даних у пам’ять недостатньо швидка, GPU просто буде простоювати. Це і є «стена пам’яті» — іншими словами, додавання більше відеокарт уже не вирішує проблему, потрібна висока відеопам’ять і пропускна здатність. Rubin має вирішити саме цю проблему.
2) Тому HBM4, вперше представлений Rubin, — це четверте покоління високопродуктивної пам’яті з пропускною здатністю до 22TB/с. Але ще важливіше те, що він працює у парі з технологією NVLink 6 (з пропускною здатністю в межах 260TB/с у межах системи), що робить 72 карти логічно «одним великим чіпом».
Що це означає? Раніше ви купували відеокарту — окремий компонент, і передача даних між картами була схожа на доставку через кілька перевалочних пунктів. Тепер Rubin за допомогою високої щільності з’єднань дозволяє даним майже не відчувати фізичної відстані між GPU, і 72 карти працюють як один «мозок».
Я вважаю, що це і є справжній козир Rubin: не просто додавання апаратних параметрів, а перебудова потоків даних у системі.
3) Якщо MOE (гібридна архітектура експертів) була ударом для NVIDIA у відповідь на натиск нових гравців, таких як DeepSeek, які «жорстко» навантажують бізнес-модель з масовим використанням карт, то Rubin — це стратегічна контратака від старого Хуана. Це не змагання за менше споживання карт, а повна перебудова вартості використання AI. Звісно, цей хід означає, що NVIDIA повністю прощається з старою моделлю «жорсткого» масового використання карт.
З іншого боку, старий Хуан розраховує на інший аспект: для реального впровадження Agentic AI у різні галузі потрібно подолати ціну токенів — це тенденція, яку NVIDIA не може зупинити.
З його точки зору, краще бути тим, хто сам створює прорив, ніж чекати, поки великі гравці, такі як Google або Meta, самі розроблять свої чіпи і з’їдять ринок, або ж — щоб DeepSeek і подібні компанії зруйнували ринок за допомогою нових моделей.
4) Питання: як тепер NVIDIA, після самореволюції, буде діяти? Шлях цілком ясний: від «продажу відеокарт» до «продажу систем», від обслуговування кількох великих компаній до поширення AI серед широкого кола користувачів.
Раніше, купуючи H100, NVIDIA заробляла на самих відеокартах. Тепер Rubin повідомить вам: потрібно купити повний комплект NVL72 — 72 GPU, NVLink Switch, систему з рідинним охолодженням, серверний корпус і навіть програмне забезпечення — все у пакеті.
Загалом, старий Хуан розраховує, що, хоча вартість комплекту може зростати, додана ефективність логіки і обчислень знизить ціну за одиницю AI-обчислень для користувачів, і при цьому він не втратить частку ринку.
Але ж, ця стратегія ускладнює вхід для середніх і малих гравців. Тільки великі компанії і хмарні провайдери зможуть її реалізувати, що ще більше посилить монополію у обчислювальних ресурсах. У нинішніх умовах це — ризикована ставка, адже якщо HBM4 матиме проблеми з масовим виробництвом, її можуть замінити альтернативи від AMD, Google TPU та інших. І тоді мрія NVIDIA про системи може виявитися набагато складнішою для реалізації.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Під час виставки CES новий архітектурний підхід Rubin від NVIDIA став головною темою обговорень на ринку, крім MOE архітектури — ще одним значним проривом, і тим, що створено для епохи Agentic AI. Я детально вивчив цю тему і справді відчув, що старий Хуан (Гордон Мур) знову демонструє «самореволюцію»:
1) Раніше NVIDIA залежала від переваги у GPU-апаратурі, скориставшись бенефітами буму, коли всі великі гіганти AI активно закуповували обчислювальні ресурси для тренування великих моделей. Логіка була проста: чим більше у тебе відеокарт, тим краще ти можеш тренувати моделі.
Але тепер війна в AI перейшла з «обчислювальної потужності» у «логіку», особливо з приходом епохи Agentic AI, коли потрібно обробляти високочастотні, багатоступінчасті та дуже довгі контексти.
У цей час параметри моделей досягають трильйонів, обсяг даних — величезний, і навіть якщо GPU працює швидко, якщо передача даних у пам’ять недостатньо швидка, GPU просто буде простоювати. Це і є «стена пам’яті» — іншими словами, додавання більше відеокарт уже не вирішує проблему, потрібна висока відеопам’ять і пропускна здатність. Rubin має вирішити саме цю проблему.
2) Тому HBM4, вперше представлений Rubin, — це четверте покоління високопродуктивної пам’яті з пропускною здатністю до 22TB/с. Але ще важливіше те, що він працює у парі з технологією NVLink 6 (з пропускною здатністю в межах 260TB/с у межах системи), що робить 72 карти логічно «одним великим чіпом».
Що це означає? Раніше ви купували відеокарту — окремий компонент, і передача даних між картами була схожа на доставку через кілька перевалочних пунктів. Тепер Rubin за допомогою високої щільності з’єднань дозволяє даним майже не відчувати фізичної відстані між GPU, і 72 карти працюють як один «мозок».
Я вважаю, що це і є справжній козир Rubin: не просто додавання апаратних параметрів, а перебудова потоків даних у системі.
3) Якщо MOE (гібридна архітектура експертів) була ударом для NVIDIA у відповідь на натиск нових гравців, таких як DeepSeek, які «жорстко» навантажують бізнес-модель з масовим використанням карт, то Rubin — це стратегічна контратака від старого Хуана. Це не змагання за менше споживання карт, а повна перебудова вартості використання AI. Звісно, цей хід означає, що NVIDIA повністю прощається з старою моделлю «жорсткого» масового використання карт.
З іншого боку, старий Хуан розраховує на інший аспект: для реального впровадження Agentic AI у різні галузі потрібно подолати ціну токенів — це тенденція, яку NVIDIA не може зупинити.
З його точки зору, краще бути тим, хто сам створює прорив, ніж чекати, поки великі гравці, такі як Google або Meta, самі розроблять свої чіпи і з’їдять ринок, або ж — щоб DeepSeek і подібні компанії зруйнували ринок за допомогою нових моделей.
4) Питання: як тепер NVIDIA, після самореволюції, буде діяти? Шлях цілком ясний: від «продажу відеокарт» до «продажу систем», від обслуговування кількох великих компаній до поширення AI серед широкого кола користувачів.
Раніше, купуючи H100, NVIDIA заробляла на самих відеокартах. Тепер Rubin повідомить вам: потрібно купити повний комплект NVL72 — 72 GPU, NVLink Switch, систему з рідинним охолодженням, серверний корпус і навіть програмне забезпечення — все у пакеті.
Загалом, старий Хуан розраховує, що, хоча вартість комплекту може зростати, додана ефективність логіки і обчислень знизить ціну за одиницю AI-обчислень для користувачів, і при цьому він не втратить частку ринку.
Але ж, ця стратегія ускладнює вхід для середніх і малих гравців. Тільки великі компанії і хмарні провайдери зможуть її реалізувати, що ще більше посилить монополію у обчислювальних ресурсах. У нинішніх умовах це — ризикована ставка, адже якщо HBM4 матиме проблеми з масовим виробництвом, її можуть замінити альтернативи від AMD, Google TPU та інших. І тоді мрія NVIDIA про системи може виявитися набагато складнішою для реалізації.