Como se Alteram os Gargalos em Clusters de 100 000 GPU: As Interligações Ópticas como Infraestrutura Central

Mercados
Atualizado: 2026/06/10 05:54

Ao longo dos últimos dois anos, os debates em torno da capacidade de computação em IA centraram-se quase exclusivamente nas GPUs: a escassez de oferta do H100, as especificações de desempenho do B200 e os roadmaps de arquitetura para as próximas gerações de GPUs dominaram a narrativa do setor. Contudo, à medida que os clusters de treino de IA evoluem de milhares para dezenas de milhares, e até centenas de milhares de GPUs, emerge uma restrição estrutural mais profunda—a eficiência na movimentação de dados entre GPUs está a tornar-se o limite máximo do desempenho global do cluster.

No início de 2026, Si Dong Fu, arquiteto de redes óticas da Tencent, salientou que, desde a arquitetura Pascal em 2016 até à arquitetura Blackwell em 2024, a capacidade de computação em IA aumentou cerca de 1 000 vezes em oito anos. O desempenho em inferência cresceu 32 vezes nos últimos quatro anos, enquanto o poder de treino expandiu-se 16 vezes. Entretanto, a largura de banda das redes aumentou apenas de 200G para 800G—um crescimento de quatro vezes. Este desequilíbrio, em que "a computação avança a grande velocidade enquanto as redes progridem lentamente", tornou a velocidade de transferência de dados entre nós o principal estrangulamento em clusters de grande escala, afetando gravemente a eficiência global e a utilização dos recursos.

Esta realidade está a redefinir tanto a lógica de investimento como as opções tecnológicas para a infraestrutura de IA. À medida que a tecnologia de interligação ótica evolui de um reforço localizado de desempenho para uma capacidade fundamental que sustenta operações de clusters de IA de grande escala, compreender a sua fundamentação técnica, o panorama de mercado e o valor industrial tornou-se essencial para avaliar o setor da computação em IA. Paralelamente, o lado do investimento atravessa uma transformação estrutural semelhante—da alocação de ativos isolados para sinergias entre mercados, formando uma cadeia de valor que liga a infraestrutura de computação à infraestrutura financeira.

O Desafio das Comunicações em Clusters de 100 000 GPUs: O Fosso Crescente entre Computação e Rede

A eficiência de um cluster de GPUs não é determinada pelo desempenho máximo de uma única GPU, mas sim pelo tempo necessário para que todas as GPUs concluam o cálculo colaborativo. Em cenários de treino distribuído de modelos de grande escala, a sincronização frequente de parâmetros e a troca de gradientes fazem com que a comunicação entre nós determine diretamente a eficiência global do treino. Segundo o white paper da tecnologia CPO da H3C, nos últimos anos, o desempenho das GPUs individuais aumentou muito mais rapidamente do que a largura de banda das interligações de rede. A maioria dos clusters continua a acrescentar GPUs do lado do processamento, mas a expansão da largura de banda de comunicação fica para trás. Como resultado, o tempo de comunicação ocupa uma fatia cada vez maior do tempo total de treino, com GPUs à espera de dados e a capacidade de computação efetiva a não escalar proporcionalmente ao número de GPUs.

Este fenómeno é sustentado por dados quantitativos claros. A apresentação da Tencent mostra que, nos últimos quatro anos, o poder de treino cresceu 16 vezes, o de inferência 32 vezes, enquanto a largura de banda de rede aumentou apenas de 200G para 800G—um acréscimo de quatro vezes. À medida que os clusters ultrapassam as dez mil GPUs e caminham para as cem mil, a comunicação entre GPUs deixa de ser uma simples transferência ponto-a-ponto para se tornar um sistema complexo com milhares ou dezenas de milhares de ligações simultâneas. Qualquer congestionamento ou latência numa única ligação pode atrasar todo o ciclo de treino.

Um artigo publicado pelo IEEE em fevereiro de 2026 confirma esta avaliação: à medida que os modelos de IA crescem, as interligações tornaram-se o principal estrangulamento em clusters de GPUs de grande dimensão, com as redes tradicionais de comutação por pacotes a enfrentarem desafios crescentes ao nível do consumo energético, custo e escalabilidade. A investigação demonstra que arquiteturas baseadas em comutação ótica de circuitos podem reduzir o consumo energético na camada de backbone em quase 99% e baixar os custos de ciclo de vida em oito anos em 76%.

Dados do setor indicam que este desequilíbrio estrutural está a acelerar a expansão da infraestrutura de comunicações óticas. O UBS estima que a procura global por fibra ótica cresceu a uma taxa média anual de apenas 2% nos últimos cinco anos, mas, com a rápida construção de data centers de IA, espera-se que a procura industrial cresça mais de 30% ao ano nos próximos anos, sendo que a procura de fibra associada a data centers poderá registar uma taxa de crescimento composta superior a 75%. Anteriormente, 70% a 80% da procura de fibra provinha dos operadores de telecomunicações; o UBS projeta que, até 2030, a procura proveniente de empresas e data centers representará mais de 80%. A indústria da fibra ótica está a transitar das comunicações tradicionais para se tornar um elemento central da infraestrutura de IA.

Interligações Óticas: A Solução Decisiva para os Estrangulamentos de Computação

Perante o fosso crescente entre computação e rede, a tecnologia de interligação ótica está a passar de uma opção complementar para uma escolha arquitetónica fundamental. A expansão dos clusters de IA desenvolve-se, tipicamente, em três dimensões: Scale-up (expansão vertical, interligações de alta velocidade dentro de um armário), Scale-out (expansão horizontal, interligações entre armários e nós) e Scale-across (interligações entre domínios, ligando data centers geograficamente dispersos). Cada dimensão apresenta requisitos distintos em termos de largura de banda, latência, consumo energético e distância de transmissão, mas todas convergem para o papel insubstituível das interligações óticas.

Em cenários de Scale-up, as interligações óticas substituem principalmente cabos de cobre ou switches elétricos, permitindo maior largura de banda e menor latência na comunicação intra-nó. Por exemplo, o NVL576 da NVIDIA utiliza switches Ethernet Spectrum-X baseados em tecnologia CPO, oferecendo capacidade de comutação para 512×200Gbps e integrando 32 motores fotónicos de silício de 1,6T para cenários Scale-out e Scale-across. O supernó CloudMatrix 384 da Huawei adota uma arquitetura de interligação totalmente peer-to-peer, construindo um bus de alta velocidade com 3 168 fibras óticas e 6 912 módulos LPO de 400G para agregar e interligar 384 NPUs, 192 CPUs, além de recursos de armazenamento e memória.

No plano técnico, a família de tecnologias "x"PO—representada por LPO, LRO e CPO—evolui rapidamente. A LightCounting prevê que o mercado global de módulos óticos Ethernet crescerá 35% em termos anuais para 18,9 mil milhões $ em 2026, podendo superar os 35 mil milhões $ até 2030, com a procura de módulos de alta velocidade como 800G e 1,6T a dominar. A TrendForce antecipa que a quota de módulos óticos transceivers acima de 800G nas remessas globais aumentará de 19,5% em 2024 para mais de 60% em 2026. Com base na previsão da Google de quase 4 milhões de TPUs expedidas em 2026, a procura de módulos óticos acima de 800G deverá superar os 6 milhões de unidades.

O consumo energético é um desafio central para módulos óticos pluggable. A tecnologia Apollo OCS da Google utiliza micro-refletores para conectar diretamente as fibras de dados, evitando conversões repetidas entre sinais óticos e elétricos que causam perdas energéticas e latências; um único switch OCS consome cerca de menos 95% de energia do que switches tradicionais. Em termos de latência, o chipset sem DSP da THine, concebido para interligações óticas LPO ou CPO de curto alcance, pode reduzir a latência em 90% e poupar 73% no consumo energético.

Li Junjie, Diretor-Adjunto do Instituto de Investigação da China Telecom, referiu no início de 2026 que a tecnologia de interligação ótica está a evoluir de um reforço localizado de desempenho para uma capacidade-chave que suporta supernós de IA escaláveis, flexíveis e altamente fiáveis. Seja para ultrapassar estrangulamentos de largura de banda, restrições energéticas ou limites de capacidade, as interligações óticas tornaram-se o pré-requisito para a evolução da infraestrutura de IA de milhares para centenas de milhares de GPUs.

A Mudança Estratégica da Ciena: Das Redes de Banda Larga às Redes Óticas para IA

Com as interligações óticas a assumirem um papel central na infraestrutura de IA, as opções estratégicas dos principais fornecedores de equipamentos oferecem uma perspetiva valiosa sobre a evolução do setor. A Ciena, líder global em sistemas de redes de alta velocidade, está a atravessar uma transformação estratégica fundamental.

No terceiro trimestre do exercício de 2025, a Ciena reportou receitas de 1,22 mil milhões $, impulsionadas sobretudo pelas vendas de plataformas óticas e de routing. Em simultâneo, a empresa anunciou que deixaria de investir no desenvolvimento do seu negócio de banda larga PON, redirecionando o investimento em I&D para soluções óticas centrais e para data centers, incluindo tecnologia de gestão fora de banda, e reduzindo 4% a 5% da força de trabalho, com cerca de 90 milhões $ em imparidades não monetárias de I&D. A Ciena espera que o crescimento futuro advenha principalmente dos mercados de IA e cloud hyperscale.

O CEO Gary Smith afirmou, durante a apresentação de resultados, que os clientes prestadores de serviços estão a concentrar os investimentos em rede em áreas que permitem escalar para suportar o crescimento do tráfego de IA, criando novos requisitos de sistemas e oportunidades de interligação que, em última análise, se estendem aos data centers. A Ciena referiu que os clientes de cloud hyperscale representam cerca de 50% do seu negócio, esperando uma composição semelhante em 2026.

A Ciena já registou progressos concretos na infraestrutura de IA. A empresa destacou um projeto de infraestrutura de IA na América do Norte, envolvendo interligações regionais de clusters de GPU para treino e distribuição geográfica, com a sua plataforma RLS e plug-ins WaveLogic 6 Nano 800-gig ZR. A solução DCOM de gestão fora de banda destina-se às operações de data center, ajudando operadores hyperscale a simplificar a instalação e gestão de data centers de grande escala, melhorar a escalabilidade e reduzir necessidades energéticas e de espaço.

Numa perspetiva mais ampla, a mudança estratégica da Ciena reflete um salto qualitativo na procura por redes óticas em data centers de IA. Jürgen Hatheier, CTO da Ciena para Desenvolvimento de Negócio e Parcerias Globais, assinalou uma clara tendência de mercado para ligações óticas de maior capacidade, esperando-se uma forte procura por comprimentos de onda de 1,6T até 2026. Rob Shore, responsável de Marketing do Portefólio de Redes Óticas da Nokia, prevê que os módulos pluggable coerentes de 800G se tornem o padrão de ligação ótica para redes de IA em 2026.

O mercado de redes de data centers para IA está a crescer de forma exponencial. Dados do setor apontam para uma expansão do mercado de 10,31 mil milhões $ em 2025 para 12,8 mil milhões $ em 2026, uma taxa de crescimento anual composta de 24,2%, prevendo-se que atinja 30,17 mil milhões $ até 2030. A procura de cabos óticos para aplicações de IA deverá crescer 77% em 2025, com uma taxa de crescimento anual composta de 26% até 2029—muito acima das aplicações não relacionadas com IA. A Ciena encontra-se no centro desta curva de crescimento estrutural.

Da Infraestrutura de Computação à Infraestrutura Financeira: O Panorama de Negociação de Ações da Gate

A evolução da infraestrutura ocorre não só ao nível da computação, mas também na alocação de ativos. À medida que as interligações óticas em data centers de IA se tornam a infraestrutura crítica que determina a eficiência dos clusters de GPU, as capacidades de alocação multi-ativo do lado do investimento exigem uma infraestrutura de suporte igualmente eficiente.

A expansão da Gate para a finança tradicional avança de forma sólida. Em janeiro de 2026, a plataforma lançou a funcionalidade de CFDs TradFi, abrangendo ouro, forex, índices bolsistas, matérias-primas e ações populares. Em março, expandiu para incluir tokens de ações e ETFs alavancados. Em junho, a Gate, através de uma parceria estratégica com a Alpaca, lançou oficialmente serviços de negociação de ações reais.

A Gate suporta atualmente mais de 10 000 ações e ETFs dos EUA, abrangendo empresas cotadas nas principais bolsas como a NYSE e a Nasdaq, superando largamente a maioria das plataformas de ações tokenizadas, que normalmente suportam apenas algumas centenas de ativos. Os utilizadores podem investir diretamente no mercado de valores mobiliários dos EUA utilizando USDT, com negociação de frações de ações a partir de apenas 0,01 ações, permitindo participar em ações líderes dos EUA com apenas 1 $.

No plano técnico e de parcerias, a Gate liga-se a brokers regulamentados com licença de Broker-Dealer nos EUA e qualificações de clearing, integrando-se com as principais bolsas como a NYSE e a Nasdaq. Cada ação é suportada por ativos reais custodiados de forma independente através do sistema DTC, não por derivados on-chain ou produtos mapeados RWA. Os detentores beneficiam automaticamente de todos os direitos acionistas, incluindo dividendos, desdobramentos e emissões de direitos.

As tendências do setor mostram que a integração de negociação de ações por plataformas cripto líderes é uma direção clara. Os dados revelam que 73% dos traders cripto detêm também ativos tradicionais. A abordagem da Gate permite a negociação de ações reais através de infraestrutura regulada, e não representações sintéticas ou tokenizadas, garantindo aos utilizadores verdadeira descoberta de preços e liquidação. Em combinação com os seus produtos CFD, a Gate está a evoluir de uma bolsa de ativos cripto para um hub multi-ativo que abrange cripto, finanças tradicionais e derivados.

Esta evolução está alinhada com a tendência mais ampla de tokenização de ativos RWA. Em setembro de 2025, a Gate lançou a zona Ondo, introduzindo ações e ETFs tokenizados de empresas de referência como Apple, Tesla e Microsoft. O valor total bloqueado no setor RWA já ultrapassou os 15,7 mil milhões $, com a Ondo Finance a ocupar o terceiro lugar a nível mundial, com cerca de 1,66 mil milhões $. Das ações reais às ações tokenizadas e aos CFDs sobre ações, a Gate está a construir um canal de alocação multi-camada, abrangendo diversas formas de ativos.

Conclusão

O percurso de desenvolvimento da tecnologia de interligação ótica aponta claramente para uma verdade fundamental: a competitividade dos data centers de IA está a passar de métricas de desempenho de GPU individual para indicadores de eficiência ao nível do sistema. As redes deixaram de ser apenas uma camada de suporte aos clusters de computação—são agora o pré-requisito para concretizar o potencial teórico de clusters com 100 000 GPUs. Neste contexto, o valor estratégico das empresas de infraestrutura de redes óticas está a ser reavaliado pelo mercado—a decisão da Ciena de apostar nas redes óticas para IA é a ilustração mais direta desta tendência.

Entretanto, a evolução da infraestrutura do lado do investimento é igualmente relevante. À medida que a capacidade de computação em IA se torna a força produtiva central da era digital, as plataformas que conseguem conectar eficazmente essa produtividade ao capital global veem os seus pontos de valor a deslocar-se de forma sistémica. Da computação à rede, do hardware aos ativos, é frequentemente na interseção entre o avanço tecnológico e a inovação financeira que surgem oportunidades estruturais.

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement
Gostar do conteúdo