Sina Weibo open-source VibeThinker-3B, modèle à 3B paramètres, avec des performances de raisonnement au niveau des références de pointe

2026-06-18 15:45:34

D'après Beating intelligence, l’équipe Sina Weibo a récemment open-sourcé VibeThinker-3B, un modèle de raisonnement à 3 milliards de paramètres qui atteint des performances de niveau frontière sur les tâches de mathématiques et de codage, avec certaines métriques s'approchant ou dépassant DeepSeek V3.2, GLM-5 et Gemini 3 Pro.

Construit sur Qwen2.5-Coder-3B, le modèle utilise un pipeline d'entraînement Spectrum-to-Signal avec un espace de raisonnement de 64K. Grâce à la auto-distillation et à la vérification au niveau des étapes pendant l'inférence, VibeThinker-3B a amélioré ses scores au test AIME26 de 94,3 à 97,1.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

Il y a 2h

Les modèles d'IA chinois atteindront des performances de niveau Fable d'ici le 1er trimestre 2027, selon Musk ; l'action de Zhipu atteint un sommet historique

Il y a 7h

IplanRIO de Rio admet avoir utilisé du code open-source, fait face à des allégations de mauvaise utilisation des fonds

Il y a 7h

La part d’utilisation des jetons DeepSeek grimpe à 17% sur Vercel en mai, alors que des développeurs américains réduisent leurs coûts

Il y a 7h

DeepSeek lance un mode Vision avec le framework Visual Primitives pour le raisonnement spatial

06-17 14:49

DeepSeek lève 51 milliards de yuans en Série A, Tencent mène ; la valorisation atteint 400 milliards de yuans

Analyse approfondie