Sina Weibo open-source VibeThinker-3B, modèle à 3B paramètres, avec des performances de raisonnement au niveau des références de pointe

D'après Beating intelligence, l’équipe Sina Weibo a récemment open-sourcé VibeThinker-3B, un modèle de raisonnement à 3 milliards de paramètres qui atteint des performances de niveau frontière sur les tâches de mathématiques et de codage, avec certaines métriques s'approchant ou dépassant DeepSeek V3.2, GLM-5 et Gemini 3 Pro.

Construit sur Qwen2.5-Coder-3B, le modèle utilise un pipeline d'entraînement Spectrum-to-Signal avec un espace de raisonnement de 64K. Grâce à la auto-distillation et à la vérification au niveau des étapes pendant l'inférence, VibeThinker-3B a amélioré ses scores au test AIME26 de 94,3 à 97,1.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire