🔥Alibaba PAI Mở nguồn AgenticQwen: Đào tạo vòng đua dữ liệu kép, hiệu suất 8B gần bằng 235B


Nhóm Alibaba PAI công bố và mở nguồn các mô hình dòng AgenticQwen (8B, 30B-A3B), được thiết kế dành riêng cho công cụ cấp công nghiệp. Thông qua khung học tăng cường "vòng đua dữ liệu kép", mô hình đạt điểm trung bình 47.4 trong các tiêu chuẩn TAU-2 và BFCL-V4 ở phiên bản 8B, gần bằng 52.0 của Qwen3-235B, điểm của phiên bản 30B-A3B là 50.2. Mô hình này đã được triển khai trong hệ thống sản xuất nội bộ, nhưng do giới hạn về độ dài ngữ cảnh 40K, các nhiệm vụ tìm kiếm sâu vẫn còn hạn chế.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim