Responsável pelo grande modelo de IA da Xiaomi: a competição em IA está mudando para a era dos Agentes; a autoevolução é o evento-chave para a AGI

2026-04-27 05:33:31

A responsável da equipe de Modelos de Grande Escala da Xiaomi, Luo Fuli, concedeu uma entrevista aprofundada na plataforma Bilibili em 24 de abril (ID do vídeo: BV1iVoVBgERD). A duração da entrevista foi de 3,5 horas, e foi a primeira vez que ela apresentou de forma sistemática suas opiniões técnicas publicamente como responsável técnica. Luo Fuli disse que a competição em caminhos de modelos de grande escala já passou da era do Chat para a era dos Agents e apontou que “autoevolução” será o principal evento para a AGI no próximo ano.

Da era do Chat para a era dos Agents: julgamentos técnicos centrais

（Fonte: Bilibili）

Com base no que Luo Fuli disse na entrevista do Bilibili, ela apontou que, em 2026, o foco da competição por modelos de grande escala mudará de qualidade geral de diálogo para capacidade de execução autônoma contínua em tarefas complexas. Na entrevista, ela afirmou que, atualmente, os modelos de ponta já conseguem fazer otimização autônoma em tarefas específicas e continuar executando de forma estável por 2 a 3 dias, sem necessidade de intervenção humana para ajustes. Na entrevista, ela enfatizou que a突破 da capacidade de “autoevolução” significa que os sistemas de IA começam a ter capacidade de auto-correção, e citou o caminho técnico da Anthropic e variáveis técnicas como o Claude Opus 4.6, bem como o impacto dessas variáveis em todo o ecossistema de IA.

Ajuste da alocação de poder computacional da Xiaomi e avaliação da defasagem do Pre-train

De acordo com o que Luo Fuli revelou na entrevista, a Xiaomi já fez ajustes importantes em sua estratégia de alocação de poder computacional. Ela explicou que a alocação de poder computacional normalmente usada na indústria é Pre-train:Post-train:Inference = 3:5:1, enquanto a estratégia atual da Xiaomi já foi ajustada para 3:1:1, comprimindo significativamente a proporção de pós-treinamento e, ao mesmo tempo, elevando o investimento de recursos na fase de inferência.

Na entrevista, ela explicou que essa mudança se deve ao amadurecimento da estratégia Agent RL Scaling: com isso, o pós-treinamento não precisa mais empilhar grandes quantidades de poder computacional, e o aumento de recursos na ponta de inferência reflete a necessidade de capacidade de resposta imediata nos cenários em que o Agent vai para o mundo real.

Quanto ao problema da defasagem de gerações do Pre-train em modelos de grande escala na China continental, Luo Fuli disse na entrevista que essa diferença já foi reduzida de 3 anos no passado para alguns meses, e que o foco atual da estratégia está se movendo em direção ao Agent RL Scaling. A trajetória profissional de Luo Fuli inclui o Instituto DAMO da Alibaba, a empresa de quantificação Huanfang e a DeepSeek (desenvolvedores centrais do DeepSeek-V2). Em novembro de 2025, ela se juntou à Xiaomi.

Especificações técnicas da série MiMo-V2 e ranking de open source

De acordo com o comunicado da Xiaomi de 19 de março de 2026 sobre a série MiMo-V2, desta vez foram lançados três modelos de uma só vez:

MiMo-V2-Pro：parâmetros totais, com parâmetros habilitados em 42B, arquitetura de atenção híbrida, suporte a contexto de milhão, taxa de conclusão de tarefas 81%

MiMo-V2-Omni：cenários de Agent multimodal

MiMo-V2-TTS：cenários de síntese de voz

Conforme o comunicado, o MiMo-V2-Flash, que já foi open source, ficou em segundo lugar no ranking global de modelos open source, com a velocidade de inferência atingindo 3 vezes a do DeepSeek-V3.2.

Perguntas frequentes

Como Luo Fuli define “autoevolução” e por que ela acredita que é o evento mais crucial para a AGI?

De acordo com o que Luo Fuli declarou na entrevista de 24 de abril de 2026 na Bilibili (BV1iVoVBgERD), ela apontou na entrevista que, atualmente, os modelos de ponta já conseguem fazer otimização autônoma em tarefas específicas e executar de forma estável por 2 a 3 dias sem precisar de intervenção humana, e classificou a “autoevolução” como o evento mais crucial para o desenvolvimento de AGI no próximo ano.

Que ajustes específicos a Xiaomi fez na alocação de poder computacional e qual é a lógica por trás disso?

Com base no que Luo Fuli revelou na entrevista, a proporção de alocação de poder computacional da Xiaomi foi ajustada de Pre-train:Post-train:Inference = 3:5:1 usada tradicionalmente pela indústria para 3:1:1, comprimindo significativamente a proporção de pós-treinamento; ela explicou que esse ajuste decorre do aumento da eficiência do pós-treinamento após o amadurecimento da estratégia Agent RL Scaling, e da necessidade de capacidade de resposta imediata do lado de inferência nos cenários em que o Agent é implementado.

Qual é o ranking de open source e o desempenho de velocidade do MiMo-V2-Flash?

De acordo com o comunicado oficial da Xiaomi divulgado em 19 de março de 2026, o MiMo-V2-Flash, que já foi open source, ficou em segundo lugar no ranking global de modelos open source; a velocidade de inferência é 3 vezes a do DeepSeek-V3.2, e a taxa de conclusão de tarefas da versão topo de linha MiMo-V2-Pro é de 81%.

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

04-27 04:13

Executivo da Google DeepMind: Toda Empresa de Produtos de IA Deve Criar Benchmarks Personalizados

04-27 03:41

Plataformas de e-commerce indianas lançam lojas de IA para ChatGPT, Perplexity e Gemini

04-27 03:27

He Yi's YZi Labs Invests in Chinese AI Large Language Model Company

A voz do Grok da xAI assume a linha de atendimento ao cliente da Starlink, 70% das ligações são encerradas automaticamente

Market Whisper04-27 05:22

Grande short vendedora Burry está apostando que o setor de semicondutores vai cair 30%, e mudou para comprar ações de software em queda acentuada

ChainNewsAbmedia04-27 03:04

O Agente de IA já pode reproduzir de forma independente artigos acadêmicos complexos: Mollick diz que os erros estão mais no texto original humano do que na IA

ChainNewsAbmedia04-26 03:34

O governo dos Emirados Árabes anunciou a introdução de agentes de IA, com a conclusão mais rápida em 2028 de que metade dos processos estará funcionando automaticamente

ChainNewsAbmedia04-24 08:55

A Cursor revela as razões do treinamento de XAI: o poder de computação ficou travado, e a SpaceX, por sua vez, detém opções de compra no valor de 60 bilhões de dólares

ChainNewsAbmedia04-24 07:15

Comentário

0/400

Sem comentários