ข่าวประตูเมือง วันที่ 23 เมษายน — Tencent เผยแพร่และเปิดซอร์สตัวอย่าง Hunyuan Hy3 ซึ่งเป็นโมเดลภาษาผสมแบบ mixture-of-experts (MoE) นำเสนอการผสานการคิดแบบเร็วและแบบช้า โมเดลนี้มีพารามิเตอร์ทั้งหมด 295 พันล้าน และมีพารามิเตอร์ที่ใช้งานได้ 21 พันล้าน รองรับความยาวบริบทสูงสุด 256K โทเค็น. ตัวอย่าง Hy3 เป็นโมเดลแรกที่ได้รับการฝึกหลังจากการปรับโครงสร้างของ Hunyuan และเป็นโมเดลที่ชาญฉลาดที่สุดของ Tencent จนถึงปัจจุบัน บริษัทระบุว่ามีการปรับปรุงอย่างมีนัยสำคัญในด้านการให้เหตุผลที่ซับซ้อน การปฏิบัติตามคำสั่ง การเรียนรู้ในบริบท การสร้างโค้ด ความสามารถเชิงตัวแทน (agentic) และประสิทธิภาพการอนุมาน นักวิทยาศาสตร์ด้าน AI หัวหน้าคือ Yao Shunyu กล่าวว่า ตัวอย่าง Hy3 ถือเป็นก้าวแรกของการสร้าง Hunyuan ขึ้นใหม่ และแสดงความหวังว่าการตอบรับจากชุมชนโอเพนซอร์สจะช่วยเพิ่มประโยชน์ในการใช้งานจริงของเวอร์ชันทางการ.

Tencent กำลังเร่งขยายการพรีเทรนและการเรียนรู้แบบเสริมกำลังไปพร้อมกันเพื่อยกระดับเพดานความฉลาดของโมเดล และร่วมมือกับผลิตภัณฑ์หลายรายการของ Tencent ผ่านการออกแบบร่วมเชิงลึก (deep co-design) เพื่อปรับปรุงประสิทธิภาพในโลกความเป็นจริง บริษัทได้เริ่มต้นสำรวจความสามารถของโมเดลเฉพาะทางด้วยเช่นกัน.

news.view.source

news.article.disclaimer

news.related.news

04-23 04:54

Perplexity เปิดเผย Web 搜索代理的后训练方法；基于 Qwen3.5 的模型在准确性与成本上优于 GPT-5.4

04-23 02:22

ออสเตรเลียร่วมมือกับ Anthropic เพื่อจัดการความเสี่ยงด้านความปลอดภัยไซเบอร์ของ Mythos AI

04-22 14:05

Yifan Zhang เปิดเผย DeepSeek V4 แบบครบถ้วน: 1.6T พารามิเตอร์, 384 ผู้เชี่ยวชาญพร้อม 6 การทำงานต่อการเปิดใช้งาน

04-22 11:21

Cambricon แสดงความมองโลกในแง่ดีต่อเป้ารายได้ 10 พันล้านหยวน ท่ามกลางความต้องการชิปสำหรับ AI ที่พุ่งสูงขึ้น

04-22 08:25