Acabei de ver uma notícia muito importante sobre a aquisição que a Nvidia fez. A empresa adquiriu a divisão de chips de inferência da Groq por 20 bilhões de dólares em dezembro passado, e esse movimento começa a fazer mais sentido agora.



Huang Renxiong, CEO da Nvidia, explicou em uma entrevista recente a verdadeira razão por trás dessa decisão estratégica. Ficou claro que o assunto não é apenas um aumento de produtividade comum, mas que a Nvidia está mirando em um mercado totalmente novo: o mercado de inferência de baixa latência e alto valor. Esse mercado começou a surgir recentemente, à medida que os usuários começaram a pagar preços diferentes dependendo da velocidade de resposta.

A ideia é simples, mas poderosa: se eu puder oferecer tokens com menor atraso para os programadores, eles poderão trabalhar com mais eficiência, e estarão dispostos a pagar mais por isso. Huang descreveu o assunto como uma expansão dos limites do mercado - ou seja, adicionar um setor totalmente novo em vez de focar apenas na alta produtividade.

O primeiro produto após a aquisição foi lançado em março: Groq 3 LPU, feito com tecnologia de 4 nanômetros da Samsung. Os números são impressionantes: a produtividade de inferência por megawatt em modelos com trilhões de parâmetros chega a 35 vezes maior em comparação com o Blackwell NVL72. A arquitetura da Groq é conhecida por sua baixa latência prevista, exatamente o que faltava na linha de produtos da Nvidia.

A estratégia é muito inteligente: o mesmo modelo, mas com preços diferentes dependendo do tempo de resposta. Mesmo com menor produtividade, o preço mais alto compensa essa diferença. A Groq preencheu a lacuna que existia na estratégia da Nvidia, e claramente o mercado começou a se dividir em diferentes segmentos.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar