Beating, Resemble AI เปิดตัว DramaBox ซึ่งเป็นโมเดลสร้างคำพูดบน Hugging Face วันนี้ โดยโมเดลนี้มาพร้อมความสามารถควบคุมในระดับผู้กำกับผ่านไวยากรณ์พรอมป์ต์ที่แยกส่วน—ผู้ใช้ป้อนบทสนทนาในเครื่องหมายคำพูด ขณะเดียวกันระบุคำสั่งบนเวที เช่น การถอนหายใจ การเว้นจังหวะ หรือการกระซอกอยู่นอกเครื่องหมายคำพูด โมเดลจะถ่ายทอดคำสั่งเหล่านี้เป็นคำพูดที่ใส่อารมณ์ แทนที่จะอ่านออกเสียงคำสั่งนั้นตรงๆ
DramaBox รองรับการโคลนเสียงแบบไม่ต้องมีตัวอย่าง (zero-shot) ด้วยเสียงอ้างอิงเพียง 10 วินาที และให้ผู้ใช้ตั้งค่าอายุ สำเนียง และอารมณ์ของตัวละครผ่านพรอมป์ต์ด้วยภาษาธรรมชาติ โดยให้ผลลัพธ์เป็นเสียงคุณภาพสตูดิโอแบบสเตอริโอ 48kHz เสียงที่สร้างทั้งหมดมีลายน้ำ Perth ที่มองไม่เห็นซึ่งทนต่อการบีบอัดแบบ MP3 และมีการตั้งค่าการตัดต่อเสียงมาตรฐานเพื่อป้องกันการนำไปใช้ในทางที่ผิดเกี่ยวกับ deepfake
news.related.news
OpenAI เพิ่มการตรวจจับบทสนทนา “วิกฤต” ของ ChatGPT เพื่อยกระดับความสามารถในการเตือนความเสี่ยงความรุนแรงต่อตนเอง
WhatsApp ใช้การสนทนาแบบไม่ทิ้งร่องรอยกับ Meta AI ข้อความหายอัตโนมัติ จุดชนวนความกังวลเรื่องการตั้งกลไกตรวจสอบความรับผิดชอบ
Mistral AI เจรจากับธนาคารในยุโรป เพื่อพัฒนาโมเดลความปลอดภัยทางไซเบอร์ Mythos แทนระบบเดิม