Mensagem do Gate News, 24 de abril — A líder da equipe de modelos de linguagem da Xiaomi, Luo Fuli, revelou em uma entrevista aprofundada que o modelo MiMo-V2-Pro tem 1 trilhão de parâmetros no total e exigiu milhares de GPUs para o treinamento. Ela observou que a escala de 1T representa o limite mínimo para alcançar desempenho próximo ao nível Claude Opus 4.6 e garantir uma credencial competitiva para a próxima fase de agentes de IA.
Tecnicamente, a versão Pro utiliza um mecanismo de atenção esparsa extrema, com uma proporção de 7:1 entre atenção global e atenção por janela deslizante, controlando os custos de inferência para processamento de contexto longo. O modelo também mantém a arquitetura MTP (Multi-Token Prediction) para aproveitar o poder computacional excedente e permitir inferência mais rápida.
Do lado da gestão, a equipe MiMo de 100 pessoas tem apenas 30-40 pessoas diretamente envolvidas nas iterações centrais. A equipe opera sem hierarquias formais ou divisões explícitas de subgrupos, e sem prazos definidos de entrega. Ao se deparar com problemas numéricos instáveis, como picos na perda de treinamento, a equipe prioriza interromper o treinamento para investigação, mesmo que isso signifique parar as operações por uma ou duas semanas e incorrer em custos de computação que chegam a milhões de dólares.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Cerebras busca $4 bilhão em IPO com avaliação-alvo de US$ 40 bilhões
Segundo a Bloomberg, a fabricante de chips de IA Cerebras Systems busca levantar até $4 bilhões em sua oferta pública inicial, com uma avaliação-alvo de aproximadamente US$ 40 bilhões. A empresa com sede na Califórnia planeja iniciar o roadshow do IPO já na segunda-feira (5 de maio). Os coordenadores
GateNews21m atrás
Conselho da Academia proíbe conteúdo de IA no 99º Oscar, exigindo vitórias apenas de humanos
A Academia de Artes e Ciências Cinematográficas estabeleceu novas regras rigorosas para o 99º Oscar, oficialmente proibindo conteúdo gerado por IA das principais categorias para proteger a criatividade humana.
Principais destaques:
A diretoria da Academia proíbe IA no 99º Oscar, exigindo que a indicação seja apenas de humanos para atuar an
Coinpedia50m atrás
A NVentures da Nvidia investe $50M na plataforma de IA jurídica Legora, na extensão da Série D
De acordo com a ChainCatcher, o braço de venture capital da Nvidia, a NVentures, participou da rodada de extensão da Série D da Legora, de US$ 50 milhões, marcando seu primeiro investimento em IA jurídica. A startup sueca de legal tech, que concorre com a Harvey, viu sua receita recorrente anual (ARR) ultrapassar US$ 100 milhões,
GateNews1h atrás
O CFO da OpenAI sugere adiar a IPO para 2027 em meio a desaceleração do crescimento, enquanto o CEO prefere o 4º trimestre de 2026
De acordo com a Odaily, a CFO da OpenAI, Sarah Friar, teria recomendado em particular adiar o IPO da empresa para 2027, citando a falta de atendimento aos padrões de divulgação financeira de empresas públicas, enquanto o CEO Sam Altman pretende acelerar a listagem no 4T de 2026. Os usuários ativos semanais do ChatGPT atingiram 900 milhões em
GateNews2h atrás
Bakkt conclui aquisição da DTR em meio a crescimento de receita e reestruturação estratégica
Bakkt concluiu a aquisição da Distributed Technologies Research, uma medida destinada a integrar a infraestrutura de stablecoins nativa de inteligência artificial (IA) aos seus serviços financeiros centrais.
Modernizando a liquidação global
A Bakkt Inc. finalizou sua aquisição da Distributed Technologies
Coinpedia2h atrás