ข่าวประตูเมือง วันที่ 23 เมษายน — Tencent เผยแพร่และเปิดซอร์สตัวอย่าง Hunyuan Hy3 ซึ่งเป็นโมเดลภาษาผสมแบบ mixture-of-experts (MoE) นำเสนอการผสานการคิดแบบเร็วและแบบช้า โมเดลนี้มีพารามิเตอร์ทั้งหมด 295 พันล้าน และมีพารามิเตอร์ที่ใช้งานได้ 21 พันล้าน รองรับความยาวบริบทสูงสุด 256K โทเค็น.
ตัวอย่าง Hy3 เป็นโมเดลแรกที่ได้รับการฝึกหลังจากการปรับโครงสร้างของ Hunyuan และเป็นโมเดลที่ชาญฉลาดที่สุดของ Tencent จนถึงปัจจุบัน บริษัทระบุว่ามีการปรับปรุงอย่างมีนัยสำคัญในด้านการให้เหตุผลที่ซับซ้อน การปฏิบัติตามคำสั่ง การเรียนรู้ในบริบท การสร้างโค้ด ความสามารถเชิงตัวแทน (agentic) และประสิทธิภาพการอนุมาน นักวิทยาศาสตร์ด้าน AI หัวหน้าคือ Yao Shunyu กล่าวว่า ตัวอย่าง Hy3 ถือเป็นก้าวแรกของการสร้าง Hunyuan ขึ้นใหม่ และแสดงความหวังว่าการตอบรับจากชุมชนโอเพนซอร์สจะช่วยเพิ่มประโยชน์ในการใช้งานจริงของเวอร์ชันทางการ.
Tencent กำลังเร่งขยายการพรีเทรนและการเรียนรู้แบบเสริมกำลังไปพร้อมกันเพื่อยกระดับเพดานความฉลาดของโมเดล และร่วมมือกับผลิตภัณฑ์หลายรายการของ Tencent ผ่านการออกแบบร่วมเชิงลึก (deep co-design) เพื่อปรับปรุงประสิทธิภาพในโลกความเป็นจริง บริษัทได้เริ่มต้นสำรวจความสามารถของโมเดลเฉพาะทางด้วยเช่นกัน.