จากการประเมิน Vending-Bench 2 ล่าสุดของ Andon Labs GLM 5.2 อยู่ในอันดับที่ 2 ในการทดสอบจำลองธุรกิจระยะยาว โดยเกณฑ์วัดนี้จำลองการดำเนินงาน 365 วันของบริษัทตู้จำหน่ายสินค้าอัตโนมัติ โดยให้โมเดลตัดสินใจด้านสต็อกสินค้าและราคาทุกวันตามข้อมูลทางการเงิน เพื่อประเมินความสอดคล้องในการตัดสินใจในงานระยะยาว
GLM เวอร์ชันต่าง ๆ แสดงการเติบโตเชิงเส้นที่สม่ำเสมอ โดยมีกำไรเฉลี่ยต่อเดือนเพิ่มขึ้นใกล้ 1,000 ดอลลาร์ (GLM 5 ได้คะแนนเฉลี่ย 4,432 ดอลลาร์ GLM 5.1 ทำได้ 5,634 ดอลลาร์) ในทางตรงกันข้าม Kimi K2.7 Code มีประสิทธิภาพต่ำกว่า K2.6 ในขณะที่ Minimax M3 ปรับปรุงขึ้นอย่างมีนัยสำคัญเมื่อเทียบกับ M2.5 แต่ยังคงต่ำกว่าทั้งซีรีส์ Kimi และ GLM ในด้านความสามารถในการทำกำไรโดยรวม