Acabei de ver que a equipe MiMo da Xiaomi lançou uma nova versão de modelo de código aberto, a série V2.5.


O que acho interessante é que eles usam a licença MIT, o que torna tudo bem aberto, você pode usar para produtos comerciais, continuar treinando, modificar à vontade, e eles não se importam.
Vou falar um pouco sobre os dois modelos também.
A versão Pro é um MoE de texto puro, com um total de 1,02 trilhão de parâmetros, mas não se assuste, na prática só ativa 420 bilhões, a pressão de hardware não é tão grande.
Ela é principalmente para tarefas de agente e escrita de código.
A pontuação no ClawEval é semelhante à do GPT-5.4, mas há um dado bastante atraente: cada tarefa consome cerca de 7 mil tokens, mais da metade do que outros modelos, o que equivale a uma grande economia na sua conta de tokens pelo mesmo trabalho.
Outro é a versão multimodal, com 310 bilhões de parâmetros, ativando 15 bilhões, capaz de ver, ouvir e ler imagens.
Vem com codificadores visuais e de áudio dedicados.
Ambos podem processar um contexto de cerca de 1 milhão de tokens de uma só vez, suficiente para códigos longos ou livros inteiros.
E eles também fizeram uma promoção, oferecendo 1 milhão de bilhões de tokens gratuitos por 30 dias.
Indivíduos, equipes e empresas podem solicitar, e após o período podem usar em ferramentas como Claude Code, Cursor e outros.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar