Згідно з Beating (моніторинговим акаунтом), модель GLM-5.2 із відкритим кодом від Zhipu AI досягла найвищого рівня успішності серед моделей із відкритим кодом у бенчмарку DeepSWE для складних задач з інженерії програмного забезпечення: 44% успішних спроб з першого разу за максимальної інтенсивності міркувань. Це перевершує Kimi K2.7 Code на 13 відсоткових пунктів — 31%.
За ціною 3,92 долара за задачу GLM-5.2 показує кращу продуктивність, ніж кілька популярних закритих моделей, за певних конфігурацій міркувань, зокрема Claude Sonnet 4.6 [high] — 30%, Gemini 3.5 Flash [medium] — 37% і Claude Opus 4.8 [low] — 41%.