ตาม Beating ซึ่งเป็น Thinking Machines—แล็บที่ก่อตั้งโดย Mira Murati อดีต CTO ของ OpenAI—ได้ปล่อยตัวอย่างงานวิจัย (research preview) ของโมเดล Interaction โดยมีการประมวลผลเสียงและวิดีโอแบบเรียลไทม์ในตัว พร้อมการตอบสนองแบบ micro-turn ระยะเวลา 200 มิลลิวินาที โมเดลนี้ช่วยให้ฟัง ดู และพูดได้พร้อมกัน รวมถึงรองรับการที่ผู้ใช้ขัดจังหวะได้แบบเรียลไทม์
โมเดล TML-Interaction-Small ใช้สถาปัตยกรรม MoE 276 พันล้านพารามิเตอร์ โดยมีพารามิเตอร์ที่ถูกใช้งาน 12 พันล้านต่อการอนุมาน ข้อมูลทางการระบุว่ามีความหน่วงสำหรับการผลัดกันพูด (speech turn-taking) ที่ 0.40 วินาที และคะแนน FD-bench V1.5 อยู่ที่ 77.8 ซึ่งทั้งคู่สูงกว่า GPT-Realtime-2.0 และ Gemini 3.1 Flash Live มีแผนเปิดให้เข้าถึงตัวอย่างแบบจำกัดในช่วงไม่กี่เดือนข้างหน้า
news.related.news
OpenAI เดินตามแนวทางที่ปรึกษาแบบ Palantir ไหม? ทุ่ม 4 พันล้านดอลลาร์ตั้งบริษัทอิสระ ส่ง FDE เข้าไปในองค์กรเพื่อบูรณาการงานเวิร์กโฟลว์ AI อย่างลึกซึ้ง
OpenAI เปิดตัวบริษัทผู้ให้บริการโครงสร้างระบบมูลค่า 4 พันล้านดอลลาร์: รับ Tomoro
พนักงานของ OpenAI ขายหุ้นมูลค่า 6.6 พันล้านดอลลาร์สหรัฐ โดยเฉลี่ยได้กำไรคนละ 11 ล้านดอลลาร์สหรัฐ