Xiaomi Membuka-Sumber OmniVoice, Model Kloning Suara Zero-Shot yang Mendukung 646 Bahasa

Menurut Beating, tim Kaldi di AI Lab Xiaomi telah merilis open-source OmniVoice, model TTS cloning suara zero-shot yang mendukung 646 bahasa. Model ini meniru karakteristik suara hanya dari beberapa detik audio referensi dan bekerja lintas bahasa—satu suara dapat mensintesis ucapan dalam bahasa Mandarin, Jepang, Korea, dan bahasa lainnya. Semua kode, bobot, dan data pelatihan dirilis open-source di bawah lisensi Apache-2.0.

OmniVoice memakai arsitektur yang disederhanakan dengan satu Transformer bidirectional yang langsung memetakan teks ke token akustik diskrit, sehingga mencapai inferensi 40x lebih cepat dari real-time di PyTorch. Dilatih dengan 580.000 jam audio dari 50 kumpulan data open-source, OmniVoice mengungguli sistem komersial dalam kemiripan suara dan keterpahaman di 24 bahasa yang diuji serta menyamai atau melampaui rekaman manusia di 102 bahasa.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Video Rebirth Meluncurkan Alat BACH AI untuk Pembuatan Video Multi-Shot hingga 30 Detik

Video Rebirth meluncurkan BACH pada 7 Mei, sebuah alat yang menghasilkan video multi-shot hingga 30 detik dari perintah teks dan gambar referensi. Alat ini menjaga konsistensi karakter di seluruh scene, mengikuti instruksi kamera, dan menghasilkan video native 1080p dengan efek suara, sulih suara, dan

GateNews2jam yang lalu

Tether Rilis Model AI MedPsy Medis QVAC, Raih Skor 62,62 pada Versi 17B Parameter

Menurut Odaily, Tether AI Research Group merilis QVAC MedPsy, model AI medis yang dirancang untuk berjalan secara lokal di smartphone dan perangkat wearable tanpa ketergantungan pada cloud. Versi berjumlah 1,7 miliar parameter itu memperoleh skor 62,62 pada tujuh tolok ukur medis, melampaui MedGemma-1.5-4B milik Google dengan selisih 11,42 poin

GateNews3jam yang lalu

TCV Memimpin Seri B untuk Startup Asuransi Corgi $160M

Corgi, sebuah startup asuransi bisnis berbasis di AS, mengumumkan pada 6 Mei bahwa pihaknya menghimpun pendanaan Seri B sebesar 160 juta dolar AS yang dipimpin oleh TCV pada valuasi 1,3 miliar dolar AS, menurut TechCrunch. Putaran ini juga diikuti Kindred Ventures, Leblon Capital, dan First Order Fund. Dengan demikian, total pendanaan Corgi menjadi 268

CryptoFrontier11jam yang lalu

B.AI Melampaui 1,7 Juta Pengguna pada 7 Mei, Meluncurkan Program Hadiah

Menurut B.AI, platform infrastruktur AI melampaui 1,7 juta pengguna pada 7 Mei. Platform yang berfokus pada perlindungan privasi dan infrastruktur ekonomi agen ini menawarkan kredit gratis sebanyak 500.000 untuk pengguna baru saat pendaftaran, harga tanpa markup di semua model, dan penawaran terbatas 1:1

GateNews11jam yang lalu

Osome Memangkas 70+ Peran, Meningkatkan EBITDA 50% Dengan Pergeseran Berbasis AI

Menurut Tech in Asia, platform manajemen korporat berbasis Singapura Osome telah memangkas lebih dari 70 peran selama dua tahun terakhir sambil menerapkan AI untuk menangani tugas kepatuhan seperti mencatat transaksi dan memproses faktur. CEO Eugenio Ferrante mengatakan perusahaan memperdagangkan pertumbuhan pendapatan yang lebih lambat i

GateNews15jam yang lalu

Schneider Electric Akan Membuka Pusat Pelatihan Asia Tenggara di Malaysia Tahun Ini, Alat AI Mengurangi Penggunaan Energi 2%-3%

Menurut Reuters, Schneider Electric berencana membuka pusat pelatihan Asia Tenggara di Malaysia tahun ini untuk mengatasi meningkatnya kebutuhan daya akibat ekspansi infrastruktur AI di wilayah tersebut. Pusat tersebut akan melatih para mitra dan pelanggan mengenai sistem manajemen energi dan peralatan pusat data. Schneider'

GateNews15jam yang lalu
Komentar
0/400
Tidak ada komentar