Acabei de ver que a equipe MiMo da Xiaomi lançou uma nova versão de modelo de código aberto, a série V2.5.


O que acho interessante é que eles usam a licença MIT, o que torna tudo bem aberto, você pode usar para produtos comerciais, continuar treinando por conta própria, modificar à vontade, eles não se importam.
Vou falar um pouco sobre os dois modelos também.
A versão Pro é um MoE de texto puro, com um total de 1,02 trilhão de parâmetros, mas não se assuste, na prática, ao rodar, apenas 420 bilhões são ativados, a pressão de hardware não é tão grande.
Ela é principalmente para tarefas de agente e escrita de código.
A pontuação no ClawEval é semelhante à do GPT-5.4, mas há um dado bastante atraente: cada tarefa consome cerca de 70 mil tokens, mais da metade do que outros modelos, economizando bastante na conta de tokens.
Isso significa que, para o mesmo trabalho, sua conta de tokens pode ser significativamente menor.
Outro modelo é a versão multimodal, com 310 bilhões de parâmetros, ativando 15 bilhões, capaz de ver, ouvir e ler imagens.
Vem equipado com codificadores visuais e de áudio dedicados.
Ambos podem processar um contexto de cerca de 1 milhão de tokens de uma só vez, o suficiente para códigos longos ou livros inteiros.
E eles também lançaram uma promoção, oferecendo 1 milhão de bilhões de tokens gratuitos por 30 dias.
Indivíduos, equipes e empresas podem solicitar, e após o período, podem usar em ferramentas como Claude Code, Cursor e outros.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar