Повідомлення Gate News, 25 квітня — Дефіцит GPU знову повертається, оскільки великі хмарні провайдери, зокрема Microsoft та Amazon, спрямовують обчислювальні потужності на внутрішні команди та ключових клієнтів на кшталт OpenAI й Anthropic, через що менші стартапи в сфері ШІ стикаються зі зростанням цін, подовженими термінами очікування та суворішими умовами контрактів. Керівництво з продажів Microsoft Azure повідомило співробітникам, що час очікування GPU для хмарних клієнтів, як очікується, зберігатиметься до кінця 2026 року.
Стартовий проєкт у сфері генерації зображень Krea, який залучив $83 мільйонів від інвесторів, зокрема Andreessen Horowitz і Bain Capital Ventures, раніше орендував сотні чипів Blackwell за $2.80 на годину за шестимісячним контрактом. Після поновлення запитам кількох хмарних провайдерів перестали відповідати; зрештою Krea отримала чипи за $3.70 на годину, що на 32% більше, а контракт продовжили до одного року. Генеральний директор Віктор Перес зазначив, що деякі постачальники просто не відповідали, тоді як інші наполягали на багаторічних зобов’язаннях перед тим, як розпочинати переговори. Генеральний директор провайдера GPU для хмари Lightning AI Вілл Фалкон розкрив, що компанія тримає в мережі 40,000 GPU, але приблизно 40 клієнтів у черзі потребують сумарно 400,000 GPU, при цьому орендні ціни зросли більш ніж на 25% протягом шести місяців.
Microsoft запровадила ступеневе керування доступом до GPU: приблизно 1,000 найбільших клієнтів (Tier 1) отримують пріоритетне виділення, тоді як менші клієнти, які прагнуть чипів Blackwell, мають зобов’язатися щонайменше 1,000 одиницями мінімум на один рік, а контракти починаються з десятків мільйонів доларів. Клієнти з оплатою за фактом споживання ризикують втратити доступ до GPU, якщо пристрої простоюють кілька годин. Стартапам, які беруть участь у безкоштовній програмі Microsoft for Startups, також повідомили, що недостатнє використання GPU може призвести до анулювання доступу.
Венчурна компанія General Catalyst проводить опитування своїх портфельних компаній щодо вузьких місць у обчисленнях і вивчає спільні пули GPU або стратегії колективних переговорів. Деякі стартапи розглядають прямі покупки GPU, щоб обійти черги: стартап зі ШІ для нафтогалузі Collide планує витратити приблизно $500,000 на GPU Nvidia, орендуючи місце в дата-центрі, щоб працювати незалежно й уникати невизначеності.
Пов'язані статті
eBay заборонив генеральному директору GameStop Рейну Коену просування пропозиції про придбання на понад 56 мільярдів доларів
Фондове ралі в Південній Кореї випереджає глобальні ринки на тлі буму ШІ
Bank of New York Mellon збільшує стратегіцні вкладення на 101 810 акцій до 1 млн загальної позиції на суму 187,2 млн доларів
Працівники SK Hynix отримають цього року в середньому $430 000 премій, переосмислюючи соціальний статус у Південній Кореї
Американська компанія American Bitcoin повідомляє про збиток у $81,8 млн за 1 квартал на тлі рекордного виробництва майнінгу 817 BTC
Банки з Wall Street наймають на крипторолі за $200K-$270K, вимагаючи досвід TradFi