Berita dari CoinWorld, Inworld AI merilis model sintesis suara percakapan waktu nyata TTS-2, yang mampu menyesuaikan suara berdasarkan perubahan nada bicara. Versi sebelumnya, TTS-1.5, menduduki peringkat pertama di platform penilaian pihak ketiga, mengungguli Google dan ElevenLabs. TTS-2 menambahkan empat kemampuan inti, termasuk persepsi percakapan, panduan suara bahasa alami, konsistensi lintas bahasa, dan penciptaan suara dari teks. Model ini mendukung 15 bahasa resmi dan lebih dari 90 bahasa eksperimen, dan telah tersedia di platform seperti Cloudflare, LiveKit, DeepInfra. CEO Kylan Gibbs dalam wawancara eksklusif dengan Business Insider menyatakan bahwa Inworld hanya membuat model dan API, tidak membuat produk konsumen, untuk menghindari kompetisi langsung dengan pelanggan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan