Responsável pelo grande modelo de IA da Xiaomi: a competição em IA está mudando para a era dos Agentes; a autoevolução é o evento-chave para a AGI

AI自進化

A responsável da equipe de Modelos de Grande Escala da Xiaomi, Luo Fuli, concedeu uma entrevista aprofundada na plataforma Bilibili em 24 de abril (ID do vídeo: BV1iVoVBgERD). A duração da entrevista foi de 3,5 horas, e foi a primeira vez que ela apresentou de forma sistemática suas opiniões técnicas publicamente como responsável técnica. Luo Fuli disse que a competição em caminhos de modelos de grande escala já passou da era do Chat para a era dos Agents e apontou que “autoevolução” será o principal evento para a AGI no próximo ano.

Da era do Chat para a era dos Agents: julgamentos técnicos centrais

小米大模型團隊負責人羅福莉訪談

(Fonte: Bilibili)

Com base no que Luo Fuli disse na entrevista do Bilibili, ela apontou que, em 2026, o foco da competição por modelos de grande escala mudará de qualidade geral de diálogo para capacidade de execução autônoma contínua em tarefas complexas. Na entrevista, ela afirmou que, atualmente, os modelos de ponta já conseguem fazer otimização autônoma em tarefas específicas e continuar executando de forma estável por 2 a 3 dias, sem necessidade de intervenção humana para ajustes. Na entrevista, ela enfatizou que a突破 da capacidade de “autoevolução” significa que os sistemas de IA começam a ter capacidade de auto-correção, e citou o caminho técnico da Anthropic e variáveis técnicas como o Claude Opus 4.6, bem como o impacto dessas variáveis em todo o ecossistema de IA.

Ajuste da alocação de poder computacional da Xiaomi e avaliação da defasagem do Pre-train

De acordo com o que Luo Fuli revelou na entrevista, a Xiaomi já fez ajustes importantes em sua estratégia de alocação de poder computacional. Ela explicou que a alocação de poder computacional normalmente usada na indústria é Pre-train:Post-train:Inference = 3:5:1, enquanto a estratégia atual da Xiaomi já foi ajustada para 3:1:1, comprimindo significativamente a proporção de pós-treinamento e, ao mesmo tempo, elevando o investimento de recursos na fase de inferência.

Na entrevista, ela explicou que essa mudança se deve ao amadurecimento da estratégia Agent RL Scaling: com isso, o pós-treinamento não precisa mais empilhar grandes quantidades de poder computacional, e o aumento de recursos na ponta de inferência reflete a necessidade de capacidade de resposta imediata nos cenários em que o Agent vai para o mundo real.

Quanto ao problema da defasagem de gerações do Pre-train em modelos de grande escala na China continental, Luo Fuli disse na entrevista que essa diferença já foi reduzida de 3 anos no passado para alguns meses, e que o foco atual da estratégia está se movendo em direção ao Agent RL Scaling. A trajetória profissional de Luo Fuli inclui o Instituto DAMO da Alibaba, a empresa de quantificação Huanfang e a DeepSeek (desenvolvedores centrais do DeepSeek-V2). Em novembro de 2025, ela se juntou à Xiaomi.

Especificações técnicas da série MiMo-V2 e ranking de open source

De acordo com o comunicado da Xiaomi de 19 de março de 2026 sobre a série MiMo-V2, desta vez foram lançados três modelos de uma só vez:

MiMo-V2-Pro:parâmetros totais, com parâmetros habilitados em 42B, arquitetura de atenção híbrida, suporte a contexto de milhão, taxa de conclusão de tarefas 81%

MiMo-V2-Omni:cenários de Agent multimodal

MiMo-V2-TTS:cenários de síntese de voz

Conforme o comunicado, o MiMo-V2-Flash, que já foi open source, ficou em segundo lugar no ranking global de modelos open source, com a velocidade de inferência atingindo 3 vezes a do DeepSeek-V3.2.

Perguntas frequentes

Como Luo Fuli define “autoevolução” e por que ela acredita que é o evento mais crucial para a AGI?

De acordo com o que Luo Fuli declarou na entrevista de 24 de abril de 2026 na Bilibili (BV1iVoVBgERD), ela apontou na entrevista que, atualmente, os modelos de ponta já conseguem fazer otimização autônoma em tarefas específicas e executar de forma estável por 2 a 3 dias sem precisar de intervenção humana, e classificou a “autoevolução” como o evento mais crucial para o desenvolvimento de AGI no próximo ano.

Que ajustes específicos a Xiaomi fez na alocação de poder computacional e qual é a lógica por trás disso?

Com base no que Luo Fuli revelou na entrevista, a proporção de alocação de poder computacional da Xiaomi foi ajustada de Pre-train:Post-train:Inference = 3:5:1 usada tradicionalmente pela indústria para 3:1:1, comprimindo significativamente a proporção de pós-treinamento; ela explicou que esse ajuste decorre do aumento da eficiência do pós-treinamento após o amadurecimento da estratégia Agent RL Scaling, e da necessidade de capacidade de resposta imediata do lado de inferência nos cenários em que o Agent é implementado.

Qual é o ranking de open source e o desempenho de velocidade do MiMo-V2-Flash?

De acordo com o comunicado oficial da Xiaomi divulgado em 19 de março de 2026, o MiMo-V2-Flash, que já foi open source, ficou em segundo lugar no ranking global de modelos open source; a velocidade de inferência é 3 vezes a do DeepSeek-V3.2, e a taxa de conclusão de tarefas da versão topo de linha MiMo-V2-Pro é de 81%.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

FIS e Anthropic desenvolvem agentes de IA para combate à lavagem de dinheiro, com implementação no BMO e no Amalgamated Bank no 2º semestre de 2026

A FIS e a Anthropic estão desenvolvendo agentes de IA projetados para automatizar investigações de crimes financeiros, começando com operações de combate à lavagem de dinheiro. O Agente de IA para Crimes Financeiros vai extrair dados de sistemas bancários, avaliar transações em relação a tipologias conhecidas e ajudar investigadores na revisão de al

GateNews6m atrás

A Prime Intellect Lab lança disponibilidade geral em 7 de maio e conclui mais de 10.000 execuções de treinamento na versão beta

De acordo com a Prime Intellect, a plataforma Lab da empresa saiu da fase beta em 7 de maio de 2026, passando para disponibilidade geral como um ambiente de treinamento ponta a ponta para agentes de IA autoaprimoráveis. O pipeline unificado consolida fluxos de trabalho de melhoria de modelos, permitindo que os usuários definam tarefas, configurem

GateNews37m atrás

A Cloudflare dispara 1 bilhão de respostas HTTP 402 por dia no Consensus 2026 e lança o Framework de Confiança de Agentes com a Visa e a Experian

De acordo com a Foresight News, a diretora de tecnologia (CSO) da Cloudflare, Stephanie Cohen, anunciou na Consensus 2026 que a plataforma gera aproximadamente 1 bilhão de respostas HTTP 402 por dia, refletindo a demanda dos agentes de IA por acesso pago ao conteúdo da web. A empresa, junto com Visa e Experian, apresentou o Agent Trust

GateNews2h atrás

Reid Hoffman: agentes de IA precisarão de sistemas de confiança em criptomoedas

Reid Hoffman, sócio da Greylock e cofundador do LinkedIn, afirmou que agentes autônomos precisarão de sistemas de confiança baseados em cripto para transacionar pela internet aberta, sugerindo que esse desenvolvimento pode permitir um retorno para os NFTs. A declaração de Hoffman conecta o surgimento de agentes autônomos ao

CryptoFrontier4h atrás

B.AI ultrapassa 1,7 milhão de usuários em 7 de maio e lança programa de recompensas

De acordo com a B.AI, a plataforma de infraestrutura de IA ultrapassou 1,7 milhão de usuários em 7 de maio. A plataforma, que se concentra em proteção de privacidade e infraestrutura de economia de agentes, está oferecendo aos novos usuários 500 mil créditos gratuitos ao se cadastrar, preços sem markup em todos os modelos e uma promoção por tempo limitado de 1:1

GateNews5h atrás

a16z lança fundo de criptomoedas de US$ 2,2 bilhões na 5ª rodada, liderando o investimento em três startups de IA

De acordo com o anúncio da a16z (Andreessen Horowitz) em 5 de maio, a gestora de venture capital lançou oficialmente o quinto fundo exclusivo de criptomoedas, “Crypto Fund 5”, com um montante de captação de US$ 2,2 bilhões. Na mesma ocasião, a a16z anunciou que liderou os aportes nas empresas de integração de IA Tessera Labs, na plataforma de contratação de IA Ethos e na plataforma de criação de IA Glif.

MarketWhisper5h atrás
Comentário
0/400
Sem comentários