XAI Grok เปิดให้ปรับ Custom Voices: โคลนเสียงใน 2 นาที, การยืนยันตัวตนแบบ 2 ขั้นตอน

ChainNewsAbmedia

xAI 2 พฤษภาคม เปิดตัวฟีเจอร์ Grok Custom Voices ผ่านบล็อกทางการ โดยผู้ใช้เพียงบันทึกเสียงพูดแบบเป็นธรรมชาติราว 1 นาทีในแดชบอร์ดของ xAI ระบบจะประมวลผลให้เสร็จภายใน 2 นาที และได้โมเดลเสียงแบบกำหนดเองที่ใช้ได้กับทั้ง TTS และ Voice Agent API พร้อมกันนี้ยังเปิดตัวโมเดล Grok 4.3 และอินเทอร์เฟซ Voice Library สำหรับรวบรวมทรัพยากรเสียงทั้งหมด Custom Voices ยังออกแบบกลไกยืนยันตัวตนแบบ 2 ขั้นตอน เพื่อลดความเสี่ยงจากการโคลนเสียงผู้อื่น

ฟีเจอร์: บันทึก 1 นาที, สร้าง 2 นาที, ผสานรวม TTS และ Voice Agent API

ผู้ใช้บันทึกเสียงพูดแบบเป็นธรรมชาติราว 1 นาทีในแดชบอร์ดของ xAI จากนั้นกระบวนการหลังบ้านจะดำเนินตามลำดับดังนี้: (1) การยืนยันตัวตน (2) การประมวลผลเสียง (3) การสร้างผลผลิตเป็นโมเดล โดยรวมแล้วภายใน 2 นาทีจะได้โมเดลเสียงที่นำไปใช้งานได้ Custom Voices สืบทอดความสามารถทั้งหมดของ TTS รวมถึง speech tags (แท็กเสียง) เอาต์พุตหลายภาษา และการสตรีมแบบ REST และ WebSocket สามารถนำไปใช้งานร่วมกับปลายทาง TTS ของ xAI หรือ Voice Agent API เพื่อสนทนาแบบเรียลไทม์กับเอเจนต์

Voice Library ที่เปิดพร้อมกันคืออินเทอร์เฟซสำหรับจัดการทรัพยากรเสียงทั้งหมดแบบศูนย์กลางในแดชบอร์ดของ xAI สามารถเรียกดู ดูตัวอย่าง และจัดการเสียงที่ผู้ใช้สร้างเองรวมถึงเสียงที่เตรียมไว้ เพื่อหลีกเลี่ยงการกระจายอยู่หลายหน้าจอ โดยคลังเสียงที่เตรียมไว้มีเสียงมากกว่า 80 แบบ และรองรับ 28 ภาษา

การยืนยันตัวตนแบบ 2 ขั้นตอน: ป้องกันการโคลนเสียงผู้อื่น

ก่อนการสร้างเสียง Custom Voices จะตั้งด่านยืนยันตัวตน 2 ชั้น: ชั้นที่ 1 ให้ผู้ใช้อ่านประโยคสำหรับยืนยัน ระบบจะถอดเสียงประโยคนั้นแบบทันที; ชั้นที่ 2 ระบบจะคำนวณ speaker embedding (เวกเตอร์ลักษณะเฉพาะของผู้พูด) จากทั้งประโยคยืนยันและบันทึกเสียงเต็ม จากนั้นนำมาเทียบว่าทั้งสองสอดคล้องกับบุคคลเดียวกันหรือไม่ หากผ่านทั้ง 2 ขั้นเท่านั้น จึงจะเข้าสู่ขั้นตอนการสร้างผลผลิตโมเดลเสียง

xAI ชัดเจนว่า ผู้ใช้ไม่สามารถใช้ไฟล์บันทึกเสียงที่มีอยู่เพื่อโคลนเสียงได้ และไม่สามารถโคลนเสียงของผู้อื่นได้ การออกแบบนี้ตัดโอกาสการใช้งานแบบ “นำเอาการบันทึกการพูดในที่สาธารณะของผู้อื่นที่เปิดเผยอยู่แล้วมาแค่ก็อปปี้” โดยจำกัดขอบเขตการโคลนเสียงไว้ที่ “การบันทึกแบบเรียลไทม์โดยตัวผู้ใช้เอง” เท่านั้น สำหรับผู้ที่ติดตามประเด็นการนำการสร้างเสียงด้วย AI ไปใช้ในทางที่ผิด (เช่น การโทรหลอกลวงหรือการพากย์เสียงโดยไม่ได้รับอนุญาต) กลไกนี้ถือเป็นคำตอบที่เป็นรูปธรรมของ xAI ต่อประเด็นการปลอมแปลง

การสังเกตในระยะถัดไป: ไปพร้อม Grok 4.3 และจังหวะการขยาย Voice Library

Custom Voices และโมเดล Grok 4.3 เปิดตัวในวันเดียวกัน โดย xAI ผูก “การอัปเกรดโมเดล + ทำให้เครื่องมือด้านเสียงครบถ้วนขึ้น” ไว้ในประกาศรอบเดียวกัน จุดสังเกตต่อไปคือจังหวะการขยายคลังเสียงที่เตรียมไว้ของ Voice Library จาก 80 แบบขึ้นไป และแผนที่รองรับ 28 ภาษา จะสามารถครอบคลุมภาษาจีนตัวเต็มและภาษากลุ่มย่อยอื่น ๆ เพิ่มเติมได้หรือไม่ อีกจุดสังเกตคือการเปิดเผยเคสการนำ Voice Agent API ไปใช้จริง โดยเฉพาะตัวอย่างการบูรณาการในสถานการณ์อย่างระบบบริการลูกค้าอัตโนมัติ การผลิตพอดแคสต์ และการบริการลูกค้าหลายภาษา

บทความนี้ xAI Grok เปิด Custom Voices: โคลนใน 2 นาที, ยืนยันตัวตนแบบ 2 ขั้นตอน เผยแพร่ครั้งแรกที่ 鏈新聞 ABMedia

news.article.disclaimer

btc.bar.articles

Osome ลดบทบาทมากกว่า 70 ตำแหน่ง เพิ่ม EBITDA 50% ด้วยการเปลี่ยนไปใช้ AI

ตามรายงานของ Tech in Asia แพลตฟอร์มบริหารจัดการองค์กร Osome ซึ่งมีสำนักงานในสิงคโปร์ ได้ลดตำแหน่งงานไปแล้วมากกว่า 70 ตำแหน่งในช่วง 2 ปีที่ผ่านมา ขณะเดียวกันได้นำ AI มาใช้เพื่อจัดการงานด้านการปฏิบัติตามกฎระเบียบ เช่น การบันทึกธุรกรรมและการประมวลผลใบแจ้งหนี้ ซีอีโอ Eugenio Ferrante กล่าวว่า บริษัทได้แลกกับการเติบโตของรายได้ที่ช้าลง i

GateNews50 นาที ที่แล้ว

Schneider Electric เตรียมเปิดศูนย์ฝึกอบรมด้านการพัฒนาในเอเชียตะวันออกเฉียงใต้ในมาเลเซียภายในปีนี้ โดยเครื่องมือ AI ช่วยลดการใช้พลังงาน 2%-3%

ตามรายงานของ Reuters บริษัท Schneider Electric วางแผนจะเปิดศูนย์ฝึกอบรมในเอเชียตะวันออกเฉียงใต้ที่ประเทศมาเลเซียในปีนี้ เพื่อรับมือกับความต้องการไฟฟ้าที่เพิ่มขึ้นจากการขยายโครงสร้างพื้นฐานด้าน AI ในภูมิภาค ศูนย์ดังกล่าวจะฝึกอบรมทั้งพาร์ทเนอร์และลูกค้าเกี่ยวกับระบบบริหารจัดการพลังงานและอุปกรณ์ศูนย์ข้อมูล Schneider'

GateNews1 ชั่วโมง ที่แล้ว

Hut 8 ลงนามสัญญาศูนย์ข้อมูล AI มูลค่า 9.8 พันล้านดอลลาร์ ระยะเวลา 15 ปี ราคาหุ้นพุ่งขึ้น 36% ในช่วงก่อนเปิดตลาด

Hut 8 ประกาศเช่าศูนย์ข้อมูล AI แห่งแรกของ Beacon Point ในรัฐเท็กซัส ขนาด 352MW จากทั้งหมด 1GW สัญญา 15 ปี มูลค่าเริ่มต้น 9.8 พันล้านดอลลาร์สหรัฐ รวมส่วนเพิ่มรายปี 3% และมีตัวเลือกต่อสัญญาครั้งละ 5 ปีอีก 3 ครั้ง หากดำเนินการครบทั้งหมด มูลค่าสัญญาสามารถแตะราว 25.1 พันล้านดอลลาร์สหรัฐ ผู้เช่าเป็นลูกค้าระดับการลงทุนสูง ชื่อยังไม่เปิดเผย กรณีนี้สะท้อนว่า Hut 8 เปลี่ยนจากธุรกิจขุดเหมืองสู่ผู้ให้บริการโครงสร้างพื้นฐานด้าน AI โดย Beacon Point ใช้สถาปัตยกรรม NVIDIA DSX ระยะแรก 352MW คาดว่าจะจ่ายไฟได้ในไตรมาส 1 ปี 2027 และส่งมอบอาคารชุดแรกในไตรมาส 3 ขณะที่โครงการมีศักยภาพขยายได้ถึง 1GW

ChainNewsAbmedia10 ชั่วโมง ที่แล้ว

Core Scientific เข้าซื้อกิจการผู้ขุด Bitcoin Polaris ด้วยมูลค่า 421 ล้านดอลลาร์ ขยายการดำเนินงานศูนย์ข้อมูล AI

ตามรายงานของ The Block บริษัท Core Scientific ได้เข้าซื้อ Polaris DS LLC ด้วยมูลค่าประมาณ 421 ล้านดอลลาร์ในวันนี้ (6 พฤษภาคม) โดยทำสัญญาพลังงานไฟฟ้า 440 เมกะวัตต์กับ Oklahoma Gas & Electric เพื่อขยายธุรกิจโฮสติ้งสำหรับ AI และงานคอมพิวติ้งสมรรถนะสูง โรงงาน Polaris ตั้งอยู่ในโอกลาโฮมา และ

GateNews11 ชั่วโมง ที่แล้ว

Hut 8 ล็อกรายได้ศูนย์ข้อมูล AI มูลค่า 16.8 พันล้านดอลลาร์ และปล่อย 3,300 BTC ในไตรมาส 1

ตามรายงานของ PRNewswire บริษัทขุด Bitcoin ที่จดทะเบียนใน Nasdaq อย่าง Hut 8 เปิดเผยผลประกอบการทางการเงินไตรมาส 1 ปี 2026 เมื่อวันที่ 6 พฤษภาคม โดยระบุว่า AI พาร์กขนาดเมกะ 2 แห่งสร้างรายได้จากค่าเช่ามูลค่า 16.8 พันล้านดอลลาร์ บริษัทได้ปล่อย BTC ประมาณ 3,300 เหรียญ (ราว 260 ล้านดอลลาร์) ผ่านการรีไฟแนนซ์เงินกู้ที่หนุนด้วย Bitcoin

GateNews14 ชั่วโมง ที่แล้ว

Prophet เปิดตัวตลาดคาดการณ์ที่ขับเคลื่อนด้วย AI พร้อมเงินลงทุนซื้อขายสดจำนวน 10,000 ดอลลาร์ วันนี้

ตาม MetaversePost Prophet ได้เปิดตัวตลาดคาดการณ์ที่ขับเคลื่อนด้วย AI วันนี้ (6 พฤษภาคม) โดยจัดสรร $10,000 ใน USDC สำหรับการซื้อขายแบบสด ผู้ใช้สามารถเทรดโดยตรงกับคู่สัญญา AI ซึ่งสร้างราคาตามความน่าจะเป็นสำหรับแต่ละตลาด โดยบางสัญญาจะมีการชำระภายใน 24

GateNews15 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น