Thinking Machines запускає модель взаємодії з відгуком 200 мс, випереджаючи GPT-Realtime-2.0

Beating, Thinking Machines, лабораторія, заснована колишнім технічним директором OpenAI Мірою Мураті, випустила дослідницький прев’ю свого Interaction-моделю, який пропонує нативну обробку аудіо та відео в реальному часі з мікровідповідями на 200 мілісекунд. Модель дає змогу одночасно слухати, дивитися й говорити, підтримуючи переривання користувачем у реальному часі.

Модель TML-Interaction-Small використовує архітектуру MoE із 276 мільярдами параметрів, де під час кожного інференсу активується 12 мільярда параметрів. Офіційні дані показують затримку в передачі реплік мовлення 0,40 секунди та результат FD-bench V1.5 на рівні 77,8 — обидва показники перевищують GPT-Realtime-2.0 і Gemini 3.1 Flash Live. Обмежений доступ до прев’ю планують у найближчі місяці.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів