Responsável pelo grande modelo da Xiaomi: a competição em IA está a mudar para a era dos agentes, e a autoevolução é um evento-chave para a AGI

AI自進化

A responsável da equipa de modelos de IA da Xiaomi, Luo Fuli, concedeu uma entrevista em profundidade na plataforma Bilibili em 24 de abril (número do vídeo: BV1iVoVBgERD). A duração da entrevista foi de 3,5 horas, sendo a primeira vez que ela expõe de forma sistemática as suas perspectivas técnicas publicamente enquanto responsável técnica. Luo Fuli afirmou que a corrida dos grandes modelos já passou da era do Chat para a era dos Agents e indicou que a “auto-evolução” será o acontecimento-chave para a AGI no próximo ano.

Da era do Chat à era dos Agents: juízo técnico central

小米大模型團隊負責人羅福莉訪談

(Fonte: Bilibili)

Com base no que Luo Fuli disse na entrevista do Bilibili, ela afirmou que o foco da competição de grandes modelos em 2026 passará de métricas de qualidade de conversação genérica para a capacidade de execução autónoma e contínua em tarefas complexas. Na entrevista, ela afirmou que, atualmente, os modelos de topo já conseguem otimizar-se autonomamente em tarefas específicas e manter uma execução estável durante 2 a 3 dias, sem necessidade de intervenção humana para ajustes. Na entrevista, ela sublinhou que o avanço da capacidade de “auto-evolução” significa que os sistemas de IA começam a ter capacidade de autocorreção, e nomeou também as variáveis do percurso tecnológico da Anthropic e de tecnologias como o Claude Opus 4.6, bem como o impacto destas no ecossistema global de IA.

Ajustes na afetação de capacidade de computação da Xiaomi e avaliação do desfasamento de Pre-train

De acordo com as revelações de Luo Fuli durante a entrevista, a Xiaomi já realizou ajustes significativos na sua estratégia de alocação de capacidade de computação. Ela explicou que a proporção de capacidade de computação usada habitualmente na indústria é Pre-train:Post-train:Inference = 3:5:1, enquanto a estratégia atual da Xiaomi foi ajustada para 3:1:1, comprimindo de forma acentuada a proporção de treino pós-treino e, em simultâneo, aumentando o investimento de recursos na fase de inferência.

Na entrevista, ela explicou que esta mudança se deve à maturidade da estratégia de Agent RL Scaling, pelo que o pós-treino já não necessita de empilhar grandes quantidades de capacidade de computação, e o aumento de recursos na ponta de inferência reflete a necessidade de capacidades de resposta imediata nos cenários em que os Agents são implementados.

Relativamente ao problema do desfasamento de gerações (de Pre-train) nos grandes modelos no mercado doméstico, Luo Fuli afirmou que este desfasamento passou de 3 anos no passado para alguns meses, e que o foco estratégico atual está a deslocar-se para Agent RL Scaling. O percurso profissional de Luo Fuli inclui o Alibaba DAMO Academy, a empresa de quantificação Huanfang Quant e a DeepSeek (desenvolvedora principal do DeepSeek-V2), e em novembro de 2025 juntou-se à Xiaomi.

Especificações técnicas da série MiMo-V2 e rankings de open source

De acordo com o comunicado da Xiaomi publicado oficialmente em 19 de março de 2026 sobre a série MiMo-V2, desta vez foram publicados três modelos de uma só vez:

MiMo-V2-Pro:total de parâmetros, ativa parâmetros 42B, arquitetura de atenção mista, suporta contexto de milhões, taxa de conclusão de tarefas 81%

MiMo-V2-Omni:cenários de Agent de modalidade total

MiMo-V2-TTS:cenários de síntese de voz

De acordo com o comunicado, o MiMo-V2-Flash que já foi disponibilizado em open source ficou em segundo lugar no ranking global de modelos open source, e a velocidade de inferência atinge 3 vezes a do DeepSeek-V3.2.

Perguntas frequentes

Como é que Luo Fuli define “auto-evolução” e por que razão considera que é o evento mais crucial para a AGI?

Com base no que Luo Fuli afirmou numa entrevista na Bilibili em 24 de abril de 2026 (BV1iVoVBgERD), ela indicou que, atualmente, os modelos de topo já conseguem otimizar-se autonomamente em tarefas específicas e executar de forma estável durante 2 a 3 dias sem necessidade de intervenção humana, e classificou a “auto-evolução” como o evento mais crucial para o desenvolvimento da AGI no próximo ano.

Que ajustes concretos fez a Xiaomi na afetação de capacidade de computação e qual é a lógica por trás?

Com base nas revelações de Luo Fuli na entrevista, a afetação de capacidade de computação da Xiaomi foi ajustada de Pre-train:Post-train:Inference = 3:5:1, utilizada habitualmente na indústria, para 3:1:1, comprimindo de forma acentuada a proporção do treino pós-treino; ela explicou que esta mudança se deve ao facto de, após a maturidade da estratégia de Agent RL Scaling, a eficiência do pós-treino ter aumentado e às necessidades de capacidades de resposta imediata no lado da inferência para os cenários de implementação de Agents.

Qual é o ranking open source e o desempenho de velocidade do MiMo-V2-Flash?

De acordo com o comunicado oficial publicado pela Xiaomi em 19 de março de 2026, o MiMo-V2-Flash disponibilizado em open source ficou em segundo lugar no ranking global de modelos open source, e a velocidade de inferência é 3 vezes a do DeepSeek-V3.2; a taxa de conclusão de tarefas da versão flagship MiMo-V2-Pro é de 81%.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Fundador da Cardano: os agentes de IA irão ultrapassar a actividade na Internet dos humanos até 2035, perturbando os modelos baseados em publicidade

De acordo com a CoinDesk, o fundador da Cardano, Charles Hoskinson, previu na conferência Consensus, a 7 de maio, que os agentes de IA irão ultrapassar a atividade humana nas pesquisas na internet, no comércio e nas transações até 2035. Como os agentes de IA não clicam em anúncios nem demonstram preferências de marca, Hoskinson disse isto a

GateNews9m atrás

Líder do Claude Code Boris: os agentes de IA aumentam a produtividade humana e reescrevem a história do desenvolvimento de software

O responsável do Claude Code, Boris Cherny, numa entrevista à CNBC, indicou que ferramentas de agentes de IA como a Co-Work podem encarregar a IA de tarefas morosas; os engenheiros deixam de ser operadores e passam a ser orientadores, conseguindo simultaneamente ativar vários agentes para tratar a depuração, aumentando de forma significativa a produtividade. As empresas têm de reorganizar os processos tendo a IA como núcleo; a IA tem vindo a demonstrar valor em todas as áreas. O desenvolvimento de software passará de escrever código para uma colaboração orientada por lógica e por conversas, baixando os patamares técnicos e impulsionando um crescimento explosivo da inovação e do empreendedorismo.

ChainNewsAbmedia54m atrás

Reid Hoffman: os NFTs poderão regressar à medida que os agentes de IA necessitem de confiança em cripto

Reid Hoffman, parceiro da Greylock e cofundador do LinkedIn, disse que os agentes autónomos vão precisar de sistemas de confiança baseados em cripto para transaccionar através da Internet aberta, sugerindo que os NFTs podem regressar, de acordo com a sua declaração. Agentes de IA e Infra-estrutura de Confiança As observações de Hoffman apontam para um potencial

CryptoFrontier2h atrás

A IBM alarga a sua suite de IA empresarial com novas ferramentas baseadas em agentes na Think 2026

De acordo com a IBM, a empresa anunciou uma expansão das suas capacidades de IA empresarial na conferência Think 2026, em Boston, com a disponibilização de novas ferramentas baseadas em agentes para ajudar as organizações a integrar a inteligência artificial nas operações diárias. Context Studio, agora geralmente disponível, permite às empresas

GateNews3h atrás

Sonhos com o Claude da Anthropic: os agentes auto-organizam memórias entre tarefas, eliminam duplicados e contradições

A Anthropic, na conferência Code with Claude, anunciou os Dreams, permitindo que os Claude Managed Agents organizem automaticamente memórias entre múltiplas sessões de conversa, eliminem duplicados e contradições, e atualizem entradas desatualizadas, produzindo uma base de memórias finalizável e auditável; o limite de entrada é de 100 sessões e 4.096 caracteres, com execução assíncrona, concluída entre alguns minutos e algumas dezenas de minutos, e com suporte para observação por streaming. A pré-visualização da investigação requer candidatura; por agora, apenas suporta claude-opus-4-7 e claude-sonnet-4-6, com data de lançamento oficial ainda por definir.

ChainNewsAbmedia6h atrás

A Cloudflare em parceria com a Stripe lança agentes de negociação autónoma: a IA pode criar contas, comprar domínios e implementar aplicações

A Cloudflare e a Stripe lançaram em 30 de abril um novo protocolo em conjunto, permitindo que os AI Agent criem, por si próprios e sem intervenção humana, uma conta na Cloudflare, subscrevam planos pagos, registem domínios, obtenham tokens de API e façam a implementação direta de aplicações. O blogue oficial da Cloudflare explica que todo o processo, do início ao fim, não requer acesso humano ao painel, cópia e colagem de tokens, nem a introdução de dados do cartão de crédito; o utilizador só precisa de conceder permissões previamente e de aceitar os termos de utilização da Cloudflare. Nesta semana, esta notícia do anúncio obteve 548 pontos no Hacker News e tornou-se uma das mais marcantes notícias de infraestrutura que viabilizam a execução autónoma de tarefas por AI Agent. Três camadas de arquitetura de acordos: descoberta de serviços, autorização de identidade e monetização por tokens de pagamento Cloudflare-Stripe

ChainNewsAbmedia6h atrás
Comentar
0/400
Nenhum comentário