Menurut Beating, Resemble AI merilis DramaBox, model pembangkitan pidato, di Hugging Face hari ini. Model ini menampilkan kemampuan kontrol tingkat sutradara melalui sintaks prompt yang dipisah—pengguna memasukkan dialog dalam tanda kutip sambil menentukan arahan panggung seperti menghela napas, jeda, atau berbisik di luar kutipan. Model mengubah arahan tersebut menjadi ujaran yang diberi penekanan emosional, bukan membacanya secara harfiah.
DramaBox mendukung voice cloning zero-shot hanya dengan 10 detik audio referensi dan memungkinkan prompt bahasa alami untuk mengatur usia karakter, logat, dan emosi. Output berupa audio kualitas studio stereo 48kHz. Semua audio yang dihasilkan menyertakan watermark Perth tak terlihat yang tahan terhadap kompresi MP3 dan pengeditan audio standar untuk mencegah penyalahgunaan deepfake.
Related News
OpenAI menambahkan pendeteksian percakapan krisis ChatGPT, meningkatkan kemampuan peringatan kekerasan terhadap diri sendiri
WhatsApp meluncurkan obrolan tanpa jejak dengan Meta AI, pesan yang otomatis menghilang memicu kekhawatiran adanya mekanisme pertanggungjawaban
Mistral AI berdiskusi dengan bank-bank Eropa untuk mengembangkan model keamanan siber Mythos sebagai pengganti.