GLM 5.2 belegt den zweiten Platz in der Vending-Bench 2 Long-Term Business Simulation und zeigt ein monatliches Gewinnwachstum von ~1.000 US-Dollar.

Laut der neuesten Vending-Bench-2-Bewertung von Andon Labs belegte GLM 5.2 den zweiten Platz in einem langfristigen Geschäftssimulationstest. Der Benchmark simulierte den 365-Tage-Betrieb eines Getränkeautomatenunternehmens, wobei Modelle tägliche Entscheidungen zu Bestand und Preisgestaltung auf Basis von Finanzdaten trafen, um die Entscheidungskohärenz über längere Aufgaben hinweg zu bewerten.

GLM-Versionen zeigten ein konsistentes lineares Wachstum, mit einer durchschnittlichen monatlichen Gewinnsteigerung von nahezu 1.000 US-Dollar (GLM 5 erzielte im Durchschnitt 4.432 US-Dollar, GLM 5.1 erreichte 5.634 US-Dollar). Im Gegensatz dazu schnitt Kimi K2.7 Code im Vergleich zu K2.6 schlechter ab, während sich Minimax M3 gegenüber M2.5 deutlich verbesserte, aber in der Gesamtrentabilität deutlich unter beiden Serien (Kimi und GLM) blieb.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare