ข่าวประจำเกต วันที่ 27 เมษายน — ทีม PAI ของ Alibaba ได้เผยแพร่และเปิดซอร์ส AgenticQwen ซึ่งเป็นโมเดลภาษาระดับเอเจนต์ขนาดเล็ก ออกแบบมาสำหรับงานประยุกต์เรียกใช้เครื่องมือระดับอุตสาหกรรม โมเดลนี้มีให้เลือก 2 เวอร์ชัน ได้แก่ 8B และ 30B-A3B ได้รับการฝึกผ่านกรอบการเรียนรู้แบบเสริมแรง “dual data flywheel” ที่เป็นนวัตกรรม AgenticQwen บรรลุความสามารถระดับเอเจนต์ที่เทียบใกล้กับโมเดลระดับเกือบหนึ่งล้านล้านพารามิเตอร์ ขณะเดียวกันลดต้นทุนการอินเฟอเรนซ์ได้อย่างมีนัยสำคัญ
กลไก dual data flywheel แก้ปัญหาการทำข้อมูลสังเคราะห์ให้มีลักษณะเหมือนกันเกินไปในข้อมูลสังเคราะห์แบบดั้งเดิม reasoning flywheel จะสร้างตัวแปรที่ยากขึ้นโดยอัตโนมัติจากข้อผิดพลาดของโมเดล ในขณะที่ agentic flywheel จะขยายเวิร์กโฟลว์เชิงเส้นอย่างง่าย (เช่น กระบวนการจองตั๋ว)ให้กลายเป็นพฤติกรรมแบบ multi-branch behavior trees พร้อมข้อจำกัด การปฏิเสธ และเงื่อนไขเชิงปฏิปักษ์ จำลองสถานการณ์การตัดสินใจที่ซับซ้อนในโลกความเป็นจริง ผลการทดสอบชี้ว่า AgenticQwen-8B ทำคะแนนได้ 47.4 บนเกณฑ์วัดสภาพแวดล้อมเครื่องมือจริง (TAU-2 และ BFCL-V4) ซึ่งสูงกว่าพื้นฐาน Qwen3-8B (23.8) อย่างมาก และเข้าใกล้ Qwen3-235B (52.0) AgenticQwen-30B-A3B (โดยมีเพียง 3B พารามิเตอร์ที่ถูกเปิดใช้งาน) ทำคะแนนได้ 50.2.
โมเดลนี้ถูกนำไปใช้งานในระบบการผลิตภายในที่คล้ายกับ Manus ทำให้ช่องว่างกับโมเดล 235B ในด้านเวลาอินเฟอเรนซ์แบบ end-to-end แคบลงอย่างมาก อย่างไรก็ตาม โมเดลถูกจำกัดด้วยความยาวบริบทดั้งเดิม 40K โทเค็น ซึ่งส่งผลให้ประสิทธิภาพของมันลดลงในงาน deep search
news.related.news
DeepSeek V4 Pro บน Ollama Cloud: เชื่อมต่อ Claude Code แบบกดครั้งเดียว
กัวหมิงฉี: OpenAI จะทำ AI Agent บนมือถือ โดย MediaTek, Qualcomm และ Luxshare Precision เป็นห่วงโซ่อุปทานที่สำคัญ
Tencent Cloud QClaw เชื่อมต่อเฟรมเวิร์ก Hermes รองรับการสลับหลายโมเดล เช่น DeepSeek-V4 Pro