Beating, Thinking Machines, лабораторія, заснована колишнім технічним директором OpenAI Мірою Мураті, випустила дослідницький прев’ю свого Interaction-моделю, який пропонує нативну обробку аудіо та відео в реальному часі з мікровідповідями на 200 мілісекунд. Модель дає змогу одночасно слухати, дивитися й говорити, підтримуючи переривання користувачем у реальному часі.
Модель TML-Interaction-Small використовує архітектуру MoE із 276 мільярдами параметрів, де під час кожного інференсу активується 12 мільярда параметрів. Офіційні дані показують затримку в передачі реплік мовлення 0,40 секунди та результат FD-bench V1.5 на рівні 77,8 — обидва показники перевищують GPT-Realtime-2.0 і Gemini 3.1 Flash Live. Обмежений доступ до прев’ю планують у найближчі місяці.
Related News
OpenAI також діє як консультант у стилі Palantir? Вклали 4 млрд на створення незалежної компанії та відправили FDE в компанії для глибокої інтеграції AI-робочих процесів
OpenAI підтримує компанію з розгортання на 4 мільярди доларів: отримати Tomoro
Працівники OpenAI продали акції на суму 6,6 мільярда доларів; у середньому кожен заробив 11 мільйонів доларів