Cartesia запускає моделі Sonic-3,5 TTS і Ink-2 STT для голосового ШІ в реальному часі

S-1,25%
SONIC-1,77%
За Beating, AI-стартап голосу Cartesia оголосив про запуск Sonic-3.5 і Ink-2, сформувавши єдиний стек технологій для голосових агентів у реальному часі. Sonic-3.5 виконує перетворення тексту на мовлення з першою токен-атримкою за 90 мілісекунд і підтримує 42 мови. Ink-2 забезпечує розпізнавання мовлення в текст із частотою мовної помилки 3,6% та вбудованим виявленням черг на основі семантичного розуміння, а не лише тривалості пауз. Обидві моделі інтегруються через один API з двонаправленим стримінгом, щоб мінімізувати затримки під час передачі.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів