Message de Gate News, 25 avril — Une pénurie de GPU refait surface alors que de grands fournisseurs de cloud, dont Microsoft et Amazon, concentrent la capacité de calcul au profit de leurs équipes internes et de leurs principaux clients comme OpenAI et Anthropic, laissant les plus petites start-ups d’IA faire face à des hausses de prix, à des délais d’attente prolongés et à des conditions contractuelles plus strictes. La direction commerciale d’Azure chez Microsoft a informé les équipes que les délais d’attente des GPU pour les clients cloud devraient persister jusqu’à la fin 2026.
La start-up de génération d’images Krea, qui a levé $83 million auprès d’investisseurs dont Andreessen Horowitz et Bain Capital Ventures, louait auparavant des centaines de puces Blackwell à 2,80 $ de l’heure dans le cadre d’un contrat de six mois. Lors du renouvellement, plusieurs fournisseurs de cloud ont cessé de répondre aux demandes ; Krea a finalement obtenu des puces à 3,70 $ de l’heure, soit une hausse de 32 %, avec un contrat prolongé d’un an. Le PDG Victor Perez a noté que certains vendeurs ne répondaient simplement pas, tandis que d’autres exigeaient des engagements pluriannuels avant de négocier. Le PDG du fournisseur de cloud GPU Lightning AI, Will Falcon, a révélé que la société fait tourner 40 000 GPU en ligne, mais qu’environ 40 clients en file d’attente nécessitent un total de 400 000 GPU, les prix de location augmentant de plus de 25 % en l’espace de six mois.
Microsoft a mis en place une gestion de l’accès aux GPU par paliers : environ 1 000 des plus grands clients (Tier 1) reçoivent une allocation prioritaire, tandis que les clients plus modestes qui cherchent des puces Blackwell doivent s’engager sur au moins 1 000 unités pour une durée minimale d’un an, avec des contrats commençant à plusieurs dizaines de millions de dollars. Les clients en paiement à l’usage risquent de perdre l’accès aux GPU si les appareils restent inactifs pendant plusieurs heures. Les start-ups participant au programme free-tier de Microsoft for Startups ont également été prévenues qu’une utilisation insuffisante des GPU pourrait entraîner la révocation de l’accès.
La société de capital-risque General Catalyst interroge ses sociétés en portefeuille sur les goulots d’étranglement liés au calcul et explore des pools de GPU partagés ou des stratégies de négociation collective. Certaines start-ups envisagent l’achat direct de GPU pour contourner les files d’attente : la start-up d’IA pour l’industrie pétrolière Collide prévoit de dépenser environ 500 000 $ en GPU Nvidia, en louant des espaces de data center pour fonctionner de manière indépendante et éviter l’incertitude.
Articles similaires
Le Bitcoin reste au-dessus de 81 000 $, tandis que le Dogecoin chute de 4 % alors que les actions mondiales atteignent des records dans un contexte d’optimisme lié à un cessez-le-feu entre Israël et l’Iran
Google et Naver font passer la publicité en direction d’outils de recherche IA ; le chiffre d’affaires de Naver au T1 augmente de 16,3 % à 2,22 milliards de dollars
JPMorgan, Ripple, Mastercard testent un Trésor tokenisé pour les règlements transfrontaliers
Tableau des ETF Bitcoin : conservation, conseillers, retard dans l’infrastructure
Les ETF au comptant sur Ethereum enregistrent 11,57 millions de dollars d’entrées nettes hier, prolongeant une série de 4 jours
SoftBank bondit de 16,5% alors que la hausse des puces d’IA soutient les actions japonaises le 7 mai