Gate News-Nachricht, 25. April — Ein Engpass bei GPUs taucht erneut auf, da große Cloud-Anbieter einschließlich Microsoft und Amazon ihre Rechenkapazitäten auf interne Teams und Großkunden wie OpenAI und Anthropic konzentrieren, während kleinere KI-Startups mit Preissteigerungen, verlängerten Wartezeiten und strengeren Vertragsbedingungen konfrontiert sind. Die Vertriebsleitung von Microsoft Azure hat das Personal darüber informiert, dass die GPU-Wartezeiten für Cloud-Kunden voraussichtlich bis zum Ende des Jahres 2026 anhalten werden.
Das Startup für Bildgenerierung Krea, das $83 Millionen von Investoren unter anderem Andreessen Horowitz und Bain Capital Ventures aufgenommen hatte, hatte zuvor Hunderte Blackwell-Chips für 2,80 US-Dollar pro Stunde im Rahmen eines Sechsmonatsvertrags gemietet. Bei der Verlängerung stellten mehrere Cloud-Anbieter die Beantwortung von Anfragen ein; Krea sicherte sich letztlich Chips zu 3,70 US-Dollar pro Stunde, einem Anstieg von 32%, wobei der Vertrag auf ein Jahr verlängert wurde. CEO Victor Perez stellte fest, dass manche Anbieter schlicht nicht reagierten, während andere auf mehrjährige Verpflichtungen bestanden, bevor sie verhandelten. Der CEO des GPU-Cloud-Anbieters Lightning AI, Will Falcon, enthüllte, dass das Unternehmen 40.000 GPUs online betreibt, aber etwa 40 Kunden in der Warteschlange zusammen 400.000 GPUs benötigen, wobei die Mietpreise innerhalb von sechs Monaten um über 25% steigen.
Microsoft hat ein gestuftes GPU-Zugriffsmanagement eingeführt: Etwa 1.000 der größten Kunden (Tier 1) erhalten Prioritätszuweisungen, während kleinere Kunden, die Blackwell-Chips suchen, sich auf mindestens 1.000 Einheiten für mindestens ein Jahr festlegen müssen, wobei Verträge bei mehreren Dutzend Millionen US-Dollar beginnen. Kunden mit Pay-as-you-go riskieren, den GPU-Zugang zu verlieren, wenn die Geräte mehrere Stunden lang ungenutzt bleiben. Startups, die am kostenlosen Kontingent-Programm von Microsoft for Startups teilnehmen, wurden ebenfalls gewarnt, dass eine unzureichende GPU-Auslastung zum Entzug des Zugangs führen kann.
Die Venture-Capital-Firma General Catalyst befragt ihre Portfoliounternehmen zu Compute-Engpässen und prüft gemeinsame GPU-Pools oder gemeinsame Verhandlungsstrategien. Einige Startups überlegen, direkte GPU-Käufe zu tätigen, um Warteschlangen zu umgehen: Das KI-Startup aus der Ölbranche Collide plant, etwa 500.000 US-Dollar in Nvidia-GPUs zu investieren, stellt Rechenzentrumsfläche zur Verfügung, um unabhängig zu arbeiten und die Ungewissheit zu vermeiden.