A utilização da GPU está tão baixa quanto 11%; Musk alugou poder de computação para a Anthorpic para montar uma avaliação para o IPO da SpaceX?

ChainNewsAbmedia

Analista da Citrini Research Jukan apontou recentemente que Musk teria alugado a capacidade de computação do Memphis Colossus 1, da xAI, para a Anthorpic. Por trás disso, a hipótese é que a medida seja um tratamento de valuation para o IPO da SpaceX. Investidores não gostam de “laboratórios de AGI que queimam dinheiro”, mas gostariam de “proprietários de infraestrutura de IA que geram renda estável”. Se a SpaceXAI conseguir provar antes do IPO que a xAI não é apenas um departamento de P&D, mas sim capaz de transformar capacidade ociosa em uma nova plataforma de nuvem com receitas de locação de alto rendimento, a narrativa sobre custo de capital e valuation pode mudar completamente.

E este data center, localizado em Memphis, no Tennessee, combina GPUs das três gerações H100, H200 e GB200. Para treinamento distribuído em larga escala, uma arquitetura heterogênea causa um sério “straggler effect”: depois que as GPUs mais rápidas terminam, ainda é necessário aguardar GPUs mais lentas ou com erro para avançar, para que todo o cluster entre na próxima etapa. Mas, para trabalho de inferência, não é preciso sincronizar GPUs em alto grau como na fase de treino; as tarefas podem ser divididas de forma mais flexível entre GPUs diferentes. The Information já havia dito que a utilização das GPUs da xAI teria chegado a apenas 11%.

A visão central de Jukan é que Musk não está cedendo ao concorrente os melhores ativos de treinamento, e sim alugando o Colossus 1 — uma opção de arquitetura mista e com menor eficiência de treino — enquanto ele mantém o Colossus 2, mais adequado para treinar modelos de ponta. Em outras palavras, a xAI transformaria “pontos problemáticos do treino” em “aluguel de inferência”.

Musk ajuda a impulsionar a corrida da Claude atrás da OpenAI em capacidade de computação

De acordo com um anúncio oficial da xAI, o Colossus 1 tem mais de 220 mil GPUs NVIDIA, incluindo H100, H200 e GB200, e a Anthropic usará a capacidade total desse data center. Jukan acredita que o foco dessa transação não é apenas a Anthropic ganhar um supercomputador, mas sim que o significado de “capacidade entregável” está sendo reavaliado.

No passado, a OpenAI conquistou vantagem estrutural com um roadmap de capacidade de 30GW no longo prazo, mas a Anthropic, em um curto intervalo, conseguiu fechar de forma intensa recursos de AWS, Google, Broadcom, Google Cloud e SpaceXAI, fazendo com que suas promessas acumuladas de capacidade corressem rapidamente para alcançar. Mesmo que a quantidade total da Anthropic ainda fique abaixo das metas da OpenAI para 2030, o Colossus 1 deve entrar em operação no curto prazo, dando a ela força imediata para expandir serviços de inferência.

Jukan também aponta que a transação tem implicações estratégicas fortes. Elon Musk ainda é um adversário-chave no processo contra a OpenAI, mas ao mesmo tempo entrega 220 mil GPUs e 300MW de capacidade para uma das maiores concorrentes da OpenAI: a Anthropic. Em outras palavras, no campo jurídico, Musk enfraquece a legitimidade moral da OpenAI; já no campo de mercado, ele ajuda a Anthropic a capturar receitas e usuários da OpenAI.

Por que a xAI estaria disposta a ceder o Colossus 1?

Para isso, Jukan apresenta uma explicação mais técnica: para a xAI, o Colossus 1 talvez não seja um cluster ideal de treinamento, mas seja mais adequado para ser alugado à Anthropic para inferência.

Isso porque o Colossus 1 mistura GPUs das três gerações H100, H200 e GB200. Para treinamento distribuído em larga escala, arquiteturas heterogêneas geram um “straggler effect” severo: depois que as GPUs mais rápidas terminam, ainda é preciso esperar as GPUs mais lentas ou com erro para que todo o cluster avance para a próxima etapa. The Information já havia dito que a utilização das GPUs da xAI já chegou a 11%, em contraste com o patamar de MFU acima de 40% observável na Meta e no Google.

Mas, para inferência, o problema é muito menor. A inferência não exige que todas as GPUs fiquem altamente sincronizadas como no treinamento; as tarefas podem ser divididas de maneira mais flexível em GPUs diferentes. Por isso, Jukan entende que, embora o Colossus 1 possa ser ineficiente como cluster de treinamento, como um cluster de inferência para um único locatário ele pode virar um ativo de alto caixa.

A avaliação central de Jukan é que Musk não está passando para o concorrente o melhor ativo de treinamento: ele está alugando o Colossus 1 — com arquitetura mista e eficiência de treino menor — e mantendo para si o Colossus 2, que é mais adequado para treinar modelos de fronteira. Em outras palavras, a xAI transforma “dores do treinamento” em “aluguel de inferência”.

Ele estima que, considerando cerca de US$ 2,6 por GPU-hour, o aluguel do Colossus 1 para a Anthropic poderia gerar para xAI/SpaceXAI aproximadamente US$ 5 a 6 bilhões de receita anual. Outras estimativas de mercado são mais conservadoras; por exemplo, a Fortune cita a estimativa da analista Antoine Chkaiban, da New Street Research, segundo a qual a transação pode gerar para a SpaceX US$ 3 a 4 bilhões de receita anual e mais de US$ 2500 milhões de lucro de caixa.

Isso é extremamente crucial para a narrativa de listagem da SpaceXAI. Jukan acredita que investidores não gostam de “laboratórios de AGI que queimam dinheiro”, mas gostariam de “proprietários de infraestrutura de IA que geram renda estável”. Se a SpaceXAI puder demonstrar antes do IPO que a xAI não é apenas um departamento de P&D, mas sim capaz de transformar capacidade ociosa em uma receita de locação de alto rendimento por meio de uma nova plataforma de nuvem, a percepção do mercado sobre custo de capital e a narrativa de valuation pode mudar completamente.

Este artigo: utilização de GPUs de apenas 11%, Musk alugando capacidade de computação para Anthorpic é para empacotar valuation para o IPO da SpaceX? Apareceu pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A Tianyang Technology planeja investir entre 3,5 e 4 bilhões de iuanes em serviços de capacidade de computação

A empresa chinesa de capital aberto Tianyang Technology anunciou que assinou um acordo para investir entre 3,5 e 4 bilhões de iuanes em um projeto de serviços de computação com um período de bloqueio de 60 meses. A atividade da empresa abrange soluções de inteligência artificial, blockchain e fintech para o setor financeiro.

GateNews6h atrás

Bernstein define meta de preço de US$ 100 para a IREN após acordo de US$ 3,4 bilhões com a NVIDIA para IA

De acordo com analistas da Bernstein, a empresa definiu uma meta de preço de US$ 100 para a IREN na sexta-feira após o anúncio de uma parceria estratégica de longo prazo com a NVIDIA, que inclui um contrato de nuvem de IA de US$ 3,4 bilhões e uma opção de ações que permite que a NVIDIA invista US$ 2,1 bilhões a US$ 70 por ação. As ações da IREN fecharam a US$ 56,85 em 7 de maio, o que implica um potencial de alta de aproximadamente 76% a partir desse patamar. Os analistas da Bernstein, liderados

GateNews8h atrás

CAD (Symphony) disparou 330,80% nas últimas 24 horas

Notícia da Gate News: em 9 de maio, de acordo com os dados do Gate Markets, no momento da publicação, o CAD (Symphony) está a US$ 0,00128, com alta de 330,80% nas últimas 24 horas, tendo atingido a máxima de US$ 0,00207 e a mínima de US$ 0,000286. O volume de negociações nas últimas 24 horas chegou a US$ 55,4 mil. A capitalização de mercado atual é de cerca de US$ 1,2819 milhão. O protocolo Caduceus é uma camada modular de infraestrutura voltada para aplicações de Web3, IA e Metaverse, apoiada p

GateNews13h atrás

BNB mantém US$ 617 com o impulso dos ETFs e a queima reduzindo ainda mais a oferta

Principais insights: A BNB é negociada perto de US$ 617, enquanto os avanços dos ETFs e os burns de tokens contraem a oferta, sinalizando aumento do interesse institucional e fortalecendo a dinâmica de demanda subjacente. O crescimento de agentes de IA na BNB Chain dispara rapidamente, impulsionando a atividade dos usuários para cima e reforçando o papel da rede na sup

CryptoNewsLand21h atrás

Bittensor Dispara Após Pedidos de ETF, à medida que o Capital mira Novos Tokens

Principais insights: A Bittensor disparou após registros duplos de ETFs, com o volume subindo acentuadamente à medida que o interesse institucional em cripto de IA se fortaleceu em diversos mercados e reforçou os sinais de demanda. Cortes de oferta e altas taxas de staking limitam o TAO em circulação, sustentando a estabilidade de preço enquanto analistas projetam

CryptoNewsLand23h atrás

Bernstein define meta de US$ 100 para a IREN após acordo de US$ 3,4 bilhões com a NVIDIA para IA

De acordo com analistas da Bernstein liderados por Gautam Chhugani, a empresa definiu uma meta de preço de US$ 100 para a IREN na sexta-feira após uma parceria estratégica com a NVIDIA. O acordo inclui um contrato de nuvem de IA de US$ 3,4 bilhões e uma opção de ações que permite que a NVIDIA invista US$ 2,1 bilhões a US$ 70 por ação. As ações da IREN

GateNews05-08 14:09
Comentário
0/400
Sem comentários