Thinking Machines Meluncurkan Model Interaksi dengan Respons 200 md, Mengungguli GPT-Realtime-2.0

Menurut Beating, Thinking Machines—lab yang didirikan oleh mantan CTO OpenAI Mira Murati—merilis pratinjau riset dari model Interaction, yang menampilkan pemrosesan audio dan video real-time native dengan respons micro-turn 200 milidetik. Model ini memungkinkan pendengaran, penglihatan, dan berbicara secara bersamaan sekaligus mendukung interupsi pengguna secara real-time.

Model TML-Interaction-Small menggunakan arsitektur MoE berparameter 276 miliar dengan 12 miliar parameter yang aktif per inferensi. Data resmi menunjukkan latensi speech turn-taking 0,40 detik dan skor FD-bench V1.5 sebesar 77,8, keduanya mengungguli GPT-Realtime-2.0 dan Gemini 3.1 Flash Live. Akses pratinjau terbatas direncanakan untuk beberapa bulan mendatang.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.
Komentar
0/400
Tidak ada komentar