Artificial Analysis เปิดตัวเกณฑ์มาตรฐานสำหรับเอเจนต์เขียนโค้ด; Zhipu GLM-5.1 ขึ้นอันดับ 1 ในบรรดาโมเดลโอเพนซอร์ส

Artificial Analysis เปิดตัวดัชนี Coding Agent Index ฉบับใหม่ในวันนี้ เพื่อประเมินว่าระบบโมเดล AI ทำงานได้อย่างไรเมื่อถูกรวมเข้ากับเฟรมเวิร์กของเอเจนต์ในบenchmark สำคัญ เช่น SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 และ SWE-Atlas-QnA Zhipu GLM-5.1 ติดอันดับ 1 ในบรรดาโมเดลโอเพนซอร์สในการประเมิน แสดงให้เห็นถึงประสิทธิภาพระดับแนวหน้าในสถานการณ์การใช้งานเอเจนต์โค้ดดิ้งในโลกจริง

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น