Sina Weibo veröffentlicht VibeThinker-3B Open-Source, Modell mit 3B-Parametern erreicht die Endstufen-Leistungsfähigkeit in der Argumentationsleistung

Laut Beating Intelligence hat das Team von Sina Weibo kürzlich VibeThinker-3B als Open Source veröffentlicht – ein 3-Milliarden-Parameter-Reasoning-Modell, das bei Mathematik- und Codierungsaufgaben leistung auf Frontier-Niveau erreicht. Dabei kommen einige Kennzahlen DeepSeek V3.2, GLM-5 und Gemini 3 Pro sehr nahe oder übertreffen sie sogar.

Aufgebaut auf Qwen2.5-Coder-3B, nutzt das Modell eine Spectrum-to-Signal-Trainings-Pipeline mit einem 64K-Reasoning-Space. Durch Self-Distillation und eine schrittweise Verifikation während der Inferenz verbesserte VibeThinker-3B die AIME26-Mathematik-Testwerte von 94,3 auf 97,1.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare