Mensagem do Gate News, 25 de Abril — Uma escassez de GPUs está a reaparecer à medida que grandes fornecedores de cloud, incluindo a Microsoft e a Amazon, concentram capacidade de computação em equipas internas e grandes clientes como a OpenAI e a Anthropic, deixando as empresas mais pequenas de IA a enfrentar aumentos de preços, tempos de espera prolongados e termos contratuais mais rigorosos. A gestão comercial da Microsoft Azure informou os colaboradores de que os tempos de espera de GPUs para clientes de cloud deverão manter-se até ao final de 2026.
A startup de geração de imagens Krea, que angariou $83 milhões junto de investidores incluindo a Andreessen Horowitz e a Bain Capital Ventures, alugou anteriormente centenas de chips Blackwell a $2.80 por hora ao abrigo de um contrato de seis meses. Na renovação, vários fornecedores de cloud deixaram de responder a pedidos de informação; a Krea acabou por garantir chips a $3.70 por hora, um aumento de 32%, com o contrato estendido para um ano. O CEO Victor Perez referiu que alguns fornecedores simplesmente não responderam, enquanto outros exigiram compromissos plurianuais antes de negociarem. O CEO do fornecedor de cloud de GPU Lightning AI, Will Falcon, revelou que a empresa opera 40.000 GPUs online, mas que cerca de 40 clientes na fila exigem, em conjunto, 400.000 GPUs, com os preços de aluguer a subir mais de 25% no prazo de seis meses.
A Microsoft implementou gestão de acesso a GPUs por níveis: cerca de 1.000 dos maiores clientes (Tier 1) recebem alocação prioritária, enquanto os clientes menores que procuram chips Blackwell têm de se comprometer com pelo menos 1.000 unidades por um mínimo de um ano, com contratos que começam nos dezenas de milhões de dólares. Os clientes pay-as-you-go correm o risco de perder acesso a GPUs se os dispositivos ficarem inativos durante várias horas. As startups que participam no programa de free-tier da Microsoft for Startups também foram avisadas de que uma utilização insuficiente de GPUs pode resultar na revogação do acesso.
A empresa de capital de risco General Catalyst está a inquirir as suas empresas da carteira sobre estrangulamentos de computação e a explorar pools de GPUs partilhados ou estratégias de negociação coletiva. Algumas startups estão a considerar compras diretas de GPUs para contornar as filas: a startup de IA do setor petrolífero Collide planeia gastar aproximadamente $500,000 em GPUs Nvidia, arrendando espaço de centros de dados para operar de forma independente e evitar a incerteza.
Related Articles
Os ETFs spot de XRP registam entradas combinadas de 13,03 milhões de dólares durante a noite; o ETF de XRP da Bitwise lidera
A SEC processa 21 pessoas por um esquema de insider trading transfronteiriço com duração de uma década, gerando milhões em lucros ilegais
Sindicato dos Professores dos EUA pede escrutínio da SEC sobre a IPO da SpaceX avaliada em 2 biliões de dólares a 7 de maio
As demonstrações financeiras da Arm excedem as expectativas, o CEO alerta para a fraqueza do mercado de smartphones e lança o “AGI CPU” para expandir a quota de mercado em IA
O presidente da Nasdaq diz que a postura mais favorável da SEC permite às empresas cripto construir infraestruturas de mercado