🔥Ali PAI AgenticQwen de código aberto: treinamento com duplo ciclo de dados, desempenho de 8B próximo a 235B


A equipe do Ali PAI lançou e open-sourced a série de modelos AgenticQwen (8B, 30B-A3B), projetados especificamente para chamadas de ferramentas de nível industrial. Através da estrutura de aprendizado por reforço de "duplo ciclo de dados", o modelo obteve uma pontuação média de 47,4 nos benchmarks TAU-2 e BFCL-V4 na versão de 8B, próxima aos 52,0 do Qwen3-235B, enquanto a versão 30B-A3B atingiu 50,2.
Este modelo já está implantado em sistemas de produção internos, mas devido ao comprimento de contexto de 40K, tarefas de busca profunda ainda apresentam limitações.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar