A previsão-base do Goldman Sachs de US$ 7,6 trilhões em gastos com capital em inteligência artificial (IA) depende, em última instância, de por quanto tempo o silício específico de IA continua sendo útil. Redes descentralizadas prometem grandes eficiências de custo, mas ainda travam uma batalha contra problemas de latência, e especialistas argumentam que a viabilidade de longo prazo dependerá de priorizar verificabilidade em vez de desempenho bruto.
Um relatório recente do Goldman Sachs muda o debate do se existe demanda por inteligência artificial (IA) para quais fatores do lado da oferta vão determinar o custo real da expansão. O relatório projeta US$ 7,6 trilhões em despesas de capital em IA como linha de base, mas ressalta que esse número é altamente sensível a “variáveis de oscilação”, incluindo a vida útil do silício de IA.
Essa longevidade é vista como o fator mais crítico porque a inovação rápida pode tornar obsoletos chips padrão — que tipicamente duram de 4 a 6 anos — em apenas 3 anos, fazendo os custos dispararem. Por outro lado, um “modelo em camadas”, no qual chips mais antigos são reutilizados para tarefas mais simples, como inferência, poderia estabilizar os custos.
A complexidade do data center e a elasticidade da demanda por computação são outras variáveis que provavelmente afetam quanto capital será gasto com infraestrutura de IA nos próximos 5 anos. A escassez de capacidade da rede elétrica, de mão de obra especializada e de equipamentos elétricos também é vista como fator que alonga a implantação.
Um relatório separado, por sua vez, enquadra esse gasto gigantesco em infraestrutura como a base de uma “economia de máquinas” emergente. Nesse paradigma, agentes de IA se tornam os principais atores econômicos, executando transações de alta frequência e gerindo a alocação de recursos de forma independente. Os autores do relatório sustentam que sistemas financeiros legados, caracterizados por ciclos de liquidação lentos e estruturas rígidas de know your customer (KYC), estão fundamentalmente mal preparados para a velocidade do comércio orientado por agentes.
Consequentemente, ele posiciona cripto e protocolos descentralizados como as “vias econômicas” essenciais e sem permissão necessárias para viabilizar essa mudança. Ainda assim, céticos permanecem cautelosos, questionando se redes descentralizadas de infraestrutura física (DePINs) realmente conseguem mitigar os crescentes requisitos de capital da IA.
Vadim Taszycki, chefe de crescimento da StealthEX, observa que, embora redes descentralizadas possam oferecer economias significativas de custos, elas enfrentam limitações físicas. Embora um provedor descentralizado como Akash possa alugar uma GPU H100 por US$ 1,48 por hora, contra US$ 12,30 na Amazon Web Services, a troca é a velocidade.
“Os grandes provedores de nuvem conseguem fazer [trabalho rápido] porque suas GPUs ficam lado a lado em um único prédio, conectadas por cabos especiais que movem dados em microssegundos”, disse Taszycki. Ele explicou que redes descentralizadas, que conectam GPUs em diferentes países via internet pública, adicionam atrasos de milissegundos. Essa latência torna a orquestração descentralizada competitiva para jobs em lote e ajustes finos, mas inadequada para atender chatbots de alta escala em tempo real, em que a experiência do usuário depende de respostas quase instantâneas.
Leo Fan, fundador da Cysic, ecoou essas posições, insistindo que inferência descentralizada é inadequada para cargas de trabalho de baixa latência. Fan argumentou, porém, que latência é um critério inadequado para comparar plataformas descentralizadas e hyperscalers como AWS.
“O problema difícil não é computação distribuída, mas descoberta, escalonamento e atestação. A cunha não está no preço por token; está na verificabilidade”, disse Fan. Ele observou que ambientes de execução confiável (TEEs) e atestações de prova de conhecimento zero (ZK) permitem que redes descentralizadas disputem em setores onde confiança e verificação importam mais do que “latência de cauda”.
Além da computação, o foco está mudando para como esses projetos intensivos em capital são financiados. Embora o crédito privado tradicional tenha bastante capital, ele muitas vezes ignora negócios menores ou não padronizados. Crédito onchain oferece vantagens distintas, como permitir que investidores de varejo participem de receitas de data centers que antes eram restritas a parceiros limitados institucionais. Além disso, plataformas como Maple e Centrifuge podem fazer sindicância de empréstimos na faixa de US$ 5 milhões a US$ 50 milhões — um segmento frequentemente ignorado por empresas como Apollo devido ao custo alto de subscrição em relação às taxas.
Por fim, crédito onchain viabiliza modelos inovadores de “pagamento por inferência”, em que a receita varia conforme o uso de GPUs. Esses modelos se encaixam de forma mais natural em estruturas tokenizadas de compartilhamento de receita do que em arrendamentos tradicionais rígidos de 20 anos.
Apesar desse potencial, especialistas identificam quatro “portões” que permanecem fechados à adoção institucional: exigibilidade legal em tribunais de falência, ausência de infraestrutura de oráculo à prova de adulteração para atender cláusulas, incerteza regulatória para parcelas de bilhões de dólares e produtos fiscais e contábeis não padronizados.
O consenso indica um cronograma realista de 12 a 24 meses para que operações sindicadas de médio porte ganhem tração onchain, com a maior parte da dívida mezzanine também onchain provavelmente a 3 a 5 anos de distância. As primeiras rupturas devem vir de operadores Tier 2, e não de líderes do setor como Coreweave.
Related News
A previsão de receita da Cisco supera as expectativas, e suas ações CSCO atingem novas máximas com a bem-sucedida transição para a área de IA
Comunidades de DAO experimentam soluções de governança descentralizada
CEO da Alibaba: Quase Nenhum Cartão de GPU Fica Ocioso nos Servidores
Próxima onda de investimentos em infraestrutura de IA está onde? Relatório Citrini revela que SiC, GaN e infraestrutura de energia estão virando novas áreas de investimento