Artificial Analysis công bố điểm chuẩn tác nhân mã hoá; Zhipu GLM-5.1 xếp hạng đầu trong các mô hình mã nguồn mở

Artificial Analysis hôm nay đã công bố Chỉ số Coding Agent mới để đánh giá hiệu quả của các mô hình AI khi được kết hợp với khung tác nhân (agent) trên nhiều chuẩn đánh giá quan trọng, bao gồm SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 và SWE-Atlas-QnA. Zhipu GLM-5.1 xếp hạng đầu trong nhóm các mô hình mã nguồn mở ở lần đánh giá này, cho thấy hiệu suất dẫn đầu trong các kịch bản tác nhân mã hóa ngoài đời thực.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận