Artificial Analysis veröffentlicht einen Benchmark für Coding Agents; Zhipu GLM-5.1 belegt unter Open-Source-Modellen den ersten Platz

Artificial Analysis hat heute einen neuen Coding Agent Index veröffentlicht, um zu bewerten, wie gut KI-Modelle in Kombination mit Agenten-Frameworks über zentrale Benchmarks hinweg abschneiden, darunter SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 und SWE-Atlas-QnA. Zhipu GLM-5.1 belegte in der Auswertung den ersten Platz unter den Open-Source-Modellen und zeigte damit eine führende Performance in realen Coding-Agent-Szenarien.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare