Laut Beating Intelligence hat das Team von Sina Weibo kürzlich VibeThinker-3B als Open Source veröffentlicht – ein 3-Milliarden-Parameter-Reasoning-Modell, das bei Mathematik- und Codierungsaufgaben leistung auf Frontier-Niveau erreicht. Dabei kommen einige Kennzahlen DeepSeek V3.2, GLM-5 und Gemini 3 Pro sehr nahe oder übertreffen sie sogar.
Aufgebaut auf Qwen2.5-Coder-3B, nutzt das Modell eine Spectrum-to-Signal-Trainings-Pipeline mit einem 64K-Reasoning-Space. Durch Self-Distillation und eine schrittweise Verifikation während der Inferenz verbesserte VibeThinker-3B die AIME26-Mathematik-Testwerte von 94,3 auf 97,1.