A Sina Weibo disponibiliza em código aberto o VibeThinker-3B, um modelo com 3B parâmetros, que corresponde ao desempenho de raciocínio da fronteira

De acordo com a Beating intelligence, a equipa do Sina Weibo abriu recentemente o código-fonte do VibeThinker-3B, um modelo de raciocínio com 3 mil milhões de parâmetros que atinge um desempenho ao nível da fronteira em tarefas de matemática e programação, com algumas métricas a aproximarem-se ou a excederem o DeepSeek V3.2, o GLM-5 e o Gemini 3 Pro.

Construído sobre o Qwen2.5-Coder-3B, o modelo utiliza um pipeline de treino Spectrum-to-Signal com um espaço de raciocínio de 64K. Através de auto-destilação e verificação ao nível dos passos durante a inferência, o VibeThinker-3B melhorou as pontuações do teste de matemática AIME26 de 94,3 para 97,1.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.
Comentar
0/400
Nenhum comentário