Resemble AI เปิดตัว DramaBox โมเดลการพูดแบบควบคุมได้ระดับผู้กำกับ บน Hugging Face วันนี้

ON1.18%
PROMPT0.63%
IN-0.17%

Beating, Resemble AI เปิดตัว DramaBox ซึ่งเป็นโมเดลสร้างคำพูดบน Hugging Face วันนี้ โดยโมเดลนี้มาพร้อมความสามารถควบคุมในระดับผู้กำกับผ่านไวยากรณ์พรอมป์ต์ที่แยกส่วน—ผู้ใช้ป้อนบทสนทนาในเครื่องหมายคำพูด ขณะเดียวกันระบุคำสั่งบนเวที เช่น การถอนหายใจ การเว้นจังหวะ หรือการกระซอกอยู่นอกเครื่องหมายคำพูด โมเดลจะถ่ายทอดคำสั่งเหล่านี้เป็นคำพูดที่ใส่อารมณ์ แทนที่จะอ่านออกเสียงคำสั่งนั้นตรงๆ

DramaBox รองรับการโคลนเสียงแบบไม่ต้องมีตัวอย่าง (zero-shot) ด้วยเสียงอ้างอิงเพียง 10 วินาที และให้ผู้ใช้ตั้งค่าอายุ สำเนียง และอารมณ์ของตัวละครผ่านพรอมป์ต์ด้วยภาษาธรรมชาติ โดยให้ผลลัพธ์เป็นเสียงคุณภาพสตูดิโอแบบสเตอริโอ 48kHz เสียงที่สร้างทั้งหมดมีลายน้ำ Perth ที่มองไม่เห็นซึ่งทนต่อการบีบอัดแบบ MP3 และมีการตั้งค่าการตัดต่อเสียงมาตรฐานเพื่อป้องกันการนำไปใช้ในทางที่ผิดเกี่ยวกับ deepfake

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น