Zhipu GLM-5.2 führt den DeepSWE Open-Source-Benchmark mit einer Erfolgsquote von 44% an, übertrifft gängige Mainstream-Closed-Source-Modelle

Laut Beating (einem Monitoring-Account) hat das Open-Source-Modell GLM-5.2 von Zhipu AI die höchste Erfolgsquote unter Open-Source-Modellen im DeepSWE-Benchmark für komplexe Software-Engineering-Aufgaben erzielt: mit einer 44%-Einmal-Erfolgsrate bei maximaler Reasoning-Intensität. Damit schlägt es Kimi K2.7 Code, das 31% erreicht, um 13 Prozentpunkte.

Bei 3,92 US-Dollar pro Aufgabe übertrifft GLM-5.2 unter bestimmten Reasoning-Konfigurationen die Leistung mehrerer gängiger Closed-Source-Modelle, darunter Claude Sonnet 4.6 [high] bei 30%, Gemini 3.5 Flash [medium] bei 37% und Claude Opus 4.8 [low] bei 41%.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare