Cartesia社がリアルタイム音声AI向けにSonic-3.5 TTSおよびInk-2 STTモデルを発表

S-1.25%
SONIC-1.77%
Beatingによると、AIボイスのスタートアップであるCartesiaは、Sonic-3.5とInk-2の提供開始を発表し、統合されたリアルタイム音声エージェントの技術スタックを構築しました。Sonic-3.5は、90ミリ秒の最初のトークンまでの遅延でテキスト読み上げを行い、42言語に対応しています。Ink-2は、3.6%の単語誤り率で音声認識(speech-to-text)を提供し、沈黙の長さだけに基づくのではなく意味理解に基づくネイティブなターン検出を備えています。両モデルは、伝送遅延を最小限に抑えるための双方向ストリーミングを備えた単一のAPIを通じて統合されます。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし