Beating, Resemble AI เปิดตัว DramaBox ซึ่งเป็นโมเดลสร้างคำพูดบน Hugging Face วันนี้ โดยโมเดลนี้มาพร้อมความสามารถควบคุมในระดับผู้กำกับผ่านไวยากรณ์พรอมป์ต์ที่แยกส่วน—ผู้ใช้ป้อนบทสนทนาในเครื่องหมายคำพูด ขณะเดียวกันระบุคำสั่งบนเวที เช่น การถอนหายใจ การเว้นจังหวะ หรือการกระซอกอยู่นอกเครื่องหมายคำพูด โมเดลจะถ่ายทอดคำสั่งเหล่านี้เป็นคำพูดที่ใส่อารมณ์ แทนที่จะอ่านออกเสียงคำสั่งนั้นตรงๆ

DramaBox รองรับการโคลนเสียงแบบไม่ต้องมีตัวอย่าง (zero-shot) ด้วยเสียงอ้างอิงเพียง 10 วินาที และให้ผู้ใช้ตั้งค่าอายุ สำเนียง และอารมณ์ของตัวละครผ่านพรอมป์ต์ด้วยภาษาธรรมชาติ โดยให้ผลลัพธ์เป็นเสียงคุณภาพสตูดิโอแบบสเตอริโอ 48kHz เสียงที่สร้างทั้งหมดมีลายน้ำ Perth ที่มองไม่เห็นซึ่งทนต่อการบีบอัดแบบ MP3 และมีการตั้งค่าการตัดต่อเสียงมาตรฐานเพื่อป้องกันการนำไปใช้ในทางที่ผิดเกี่ยวกับ deepfake

news.view.source

news.article.disclaimer

news.related.news

5 ชั่วโมง ที่แล้ว

Sui เปิดตัวโมเดล Sui Spheres สำหรับสภาพแวดล้อมการดำเนินการแบบควบคุม

20 ชั่วโมง ที่แล้ว

OpenAI ปรับโครงสร้างระบบความจำของ ChatGPT ใหม่ในวันที่ 1 กันยายน และยกระดับการบูรณาการ Apple Intelligence

21 ชั่วโมง ที่แล้ว

Meta เปิดตัว Muse Spark AI พร้อมเสียง การจดจำภาพแบบเรียลไทม์ และเครื่องมือสำหรับการช้อปปิง ในวันที่ 14 พฤษภาคม

05-13 06:11

XYO เปิดตัว AI SDK เพื่อช่วยให้พัฒนาโปรเจกต์บนบล็อกเชนได้โดยไม่ต้องมีความเชี่ยวชาญด้าน Solidity ในวันที่ 12 พฤษภาคม

05-13 04:01