Alibaba เปิดตัวโมเดลเอเจนต์โอเพนซอร์ส AgenticQwen: เวอร์ชัน 8B เข้าใกล้ประสิทธิภาพ 235B ด้วย Dual Data Flywheels

GateNews

ข่าวประจำเกต วันที่ 27 เมษายน — ทีม PAI ของ Alibaba ได้เผยแพร่และเปิดซอร์ส AgenticQwen ซึ่งเป็นโมเดลภาษาระดับเอเจนต์ขนาดเล็ก ออกแบบมาสำหรับงานประยุกต์เรียกใช้เครื่องมือระดับอุตสาหกรรม โมเดลนี้มีให้เลือก 2 เวอร์ชัน ได้แก่ 8B และ 30B-A3B ได้รับการฝึกผ่านกรอบการเรียนรู้แบบเสริมแรง “dual data flywheel” ที่เป็นนวัตกรรม AgenticQwen บรรลุความสามารถระดับเอเจนต์ที่เทียบใกล้กับโมเดลระดับเกือบหนึ่งล้านล้านพารามิเตอร์ ขณะเดียวกันลดต้นทุนการอินเฟอเรนซ์ได้อย่างมีนัยสำคัญ

กลไก dual data flywheel แก้ปัญหาการทำข้อมูลสังเคราะห์ให้มีลักษณะเหมือนกันเกินไปในข้อมูลสังเคราะห์แบบดั้งเดิม reasoning flywheel จะสร้างตัวแปรที่ยากขึ้นโดยอัตโนมัติจากข้อผิดพลาดของโมเดล ในขณะที่ agentic flywheel จะขยายเวิร์กโฟลว์เชิงเส้นอย่างง่าย (เช่น กระบวนการจองตั๋ว)ให้กลายเป็นพฤติกรรมแบบ multi-branch behavior trees พร้อมข้อจำกัด การปฏิเสธ และเงื่อนไขเชิงปฏิปักษ์ จำลองสถานการณ์การตัดสินใจที่ซับซ้อนในโลกความเป็นจริง ผลการทดสอบชี้ว่า AgenticQwen-8B ทำคะแนนได้ 47.4 บนเกณฑ์วัดสภาพแวดล้อมเครื่องมือจริง (TAU-2 และ BFCL-V4) ซึ่งสูงกว่าพื้นฐาน Qwen3-8B (23.8) อย่างมาก และเข้าใกล้ Qwen3-235B (52.0) AgenticQwen-30B-A3B (โดยมีเพียง 3B พารามิเตอร์ที่ถูกเปิดใช้งาน) ทำคะแนนได้ 50.2.

โมเดลนี้ถูกนำไปใช้งานในระบบการผลิตภายในที่คล้ายกับ Manus ทำให้ช่องว่างกับโมเดล 235B ในด้านเวลาอินเฟอเรนซ์แบบ end-to-end แคบลงอย่างมาก อย่างไรก็ตาม โมเดลถูกจำกัดด้วยความยาวบริบทดั้งเดิม 40K โทเค็น ซึ่งส่งผลให้ประสิทธิภาพของมันลดลงในงาน deep search

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น