XAI Grok Hadirkan Custom Voices: Kloning 2 Menit, Verifikasi Identitas Dua Tahap

ChainNewsAbmedia

xAI pada 2 Mei meluncurkan fitur Grok Custom Voices di blog resmi, di mana pengguna hanya perlu merekam suara alami sekitar 1 menit di konsol xAI, lalu sistem akan memprosesnya dalam waktu 2 menit dan menghasilkan model suara kustom yang dapat digunakan untuk TTS dan Voice Agent API. Turut diluncurkan adalah model Grok 4.3, serta antarmuka Voice Library yang menghimpun semua sumber daya suara. Custom Voices juga dirancang dengan mekanisme verifikasi identitas dua tahap untuk mencegah kloning suara orang lain.

Fungsi: rekaman 1 menit, generasi 2 menit, integrasi TTS dan Voice Agent API

Pengguna merekam suara alami sekitar 1 menit di konsol xAI, lalu proses di belakang layar selesai berurutan: (1) verifikasi identitas, (2) pemrosesan suara, (3) produksi model. Dalam total 2 menit, pengguna bisa mendapatkan model suara yang siap digunakan. Custom Voices mewarisi semua kemampuan TTS, termasuk speech tags (tag suara), output multi-bahasa, serta streaming REST dan WebSocket; dapat langsung dipadukan dengan endpoint TTS xAI atau Voice Agent API untuk percakapan real-time dengan agen.

Voice Library yang diluncurkan serentak adalah antarmuka di konsol xAI untuk manajemen terpusat sumber daya suara, yang memungkinkan pengguna menelusuri, melakukan preview, dan mengelola semua suara buatan pengguna serta yang telah disiapkan, sehingga tidak lagi tersebar di banyak antarmuka. Pustaka suara yang telah dipersiapkan menyediakan lebih dari 80 jenis suara dan mendukung 28 bahasa.

Verifikasi identitas dua tahap: mencegah kloning suara orang lain

Sebelum generasi suara, Custom Voices menyiapkan dua tahap verifikasi identitas: pertama, pengguna membacakan sebuah kalimat verifikasi, dan sistem langsung mentranskripsikan rekaman suara bagian tersebut; kedua, sistem menghitung speaker embedding (vektor ciri pembicara) secara terpisah dari kalimat verifikasi dan rekaman lengkap, lalu membandingkan apakah keduanya milik orang yang sama. Hanya jika kedua tahap lolos, barulah masuk ke alur produksi model suara.

xAI secara tegas menyatakan: pengguna tidak dapat men-clone suara menggunakan file rekaman yang sudah ada, dan juga tidak bisa men-clone suara orang lain. Desain ini meniadakan skenario “mengambil rekaman pidato publik milik orang lain lalu menyalinnya langsung”, dengan membatasi kloning suara hanya pada satu pintu masuk, yaitu “rekaman real-time oleh pengguna sendiri”. Bagi pengamat yang menaruh perhatian pada isu penyalahgunaan generasi suara AI (seperti penipuan telepon dan sulih suara tanpa izin), mekanisme ini merupakan respons konkret xAI terhadap isu anti-pemalsuan.

Observasi berikutnya: dirilis bersamaan dengan Grok 4.3, Voice Library diperluas untuk ritme

Custom Voices dan model Grok 4.3 diluncurkan pada hari yang sama, dan xAI mengikat rilis “peningkatan model + penyempurnaan lini alat suara” dalam satu gelombang pengumuman. Titik observasi berikutnya adalah ritme perluasan pustaka suara yang telah dipersiapkan di Voice Library dari 80 jenis ke atas, serta apakah peta 28 bahasa dapat semakin mencakup bahasa-bahasa kecil seperti bahasa Mandarin tradisional. Titik observasi lainnya adalah kasus penggunaan nyata Voice Agent API yang dipublikasikan, khususnya contoh integrasi untuk skenario seperti otomasi layanan pelanggan, pembuatan rekaman podcast, dan layanan pelanggan multi-bahasa.

Artikel ini xAI Grok 推 Custom Voices:2 分鐘克隆、雙階段身分驗證 pertama kali muncul di 鏈新聞 ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Solana Foundation dan Google Cloud Meluncurkan Pay.sh AI Payment Gateway yang Mendukung 50+ Penyedia API

Menurut Odaily, Solana Foundation dan Google Cloud telah secara bersama-sama meluncurkan Pay.sh, gateway pembayaran AI yang memungkinkan agen AI memanggil layanan API menggunakan stablecoin di rantai per permintaan tanpa memerlukan akun tradisional. Dibangun di atas protokol x402 dan mendukung Tempo serta

GateNews4jam yang lalu

WorldClaw dan WLFI Luncurkan WorldRouter, Menawarkan Akses ke 300+ Model AI dengan Biaya 30% Lebih Murah

Menurut Foresight News, sistem operasi AI Agent WorldClaw telah bermitra dengan proyek kripto keluarga Trump WLFI untuk meluncurkan WorldRouter. Platform ini memungkinkan pengguna mengakses lebih dari 300 model AI mainstream melalui satu akun, dengan biaya sekitar 30% lebih rendah dibanding model masing-masing

GateNews5jam yang lalu

Epic Angels Mendukung Enaxiom dalam Putaran Seed Senilai 1,8 Juta Dolar AS untuk Teknologi Pendingin Pusat Data AI

Menurut Epic Angels, Enaxiom menutup putaran seed senilai 1,8 juta dolar AS pada 6 Mei yang didukung oleh Epic Angels, BlackNova, dan Antler, sehingga total pendanaannya menjadi 2,7 juta dolar AS. Startup deep tech asal Australia ini mengembangkan HydroCool, sebuah sistem pendingin untuk pusat data AI yang menggunakan air non-minum dan

GateNews6jam yang lalu

Cipher Digital Membukukan Kerugian Q1 Senilai 114 Juta Dolar karena Penambang Bitcoin Mempercepat Peralihan ke Pusat Data AI

Menurut The Block, Cipher Digital mencatat kerugian bersih senilai 114 juta dolar AS pada kuartal 1 2026, lebih dari dua kali lipat kerugian 39 juta dolar AS pada kuartal 1 2025, saat penambang bitcoin mempercepat peralihan ke infrastruktur AI. Pendapatan penambangan bitcoin turun menjadi 35 juta dolar AS dari 49 juta dolar AS secara year-over-year. Perusahaan menandatangani kontraknya

GateNews14jam yang lalu

Oobit Meluncurkan Kartu Visa USDT Berbasis AI untuk Bisnis pada 5 Mei

Menurut Oobit, pada 5 Mei, platform pembayaran yang didukung Tether meluncurkan kartu Visa virtual yang memungkinkan agen AI melakukan transaksi secara otonom menggunakan USDT. Kartu ini memungkinkan sistem yang digerakkan AI mengeksekusi keputusan pengeluaran tanpa intervensi manusia secara langsung, menandai langkah signifikan

GateNews14jam yang lalu

Yield.xyz dan Privy Meluncurkan Infrastruktur AI Yield Agent yang Mendukung 80+ Blockchain pada 5 Mei

Menurut BlockBeats, pada 5 Mei, platform infrastruktur imbal hasil DeFi Yield.xyz dan Privy, perusahaan infrastruktur dompet kripto dari Stripe, meluncurkan infrastruktur agen imbal hasil berbasis AI yang mendukung eksekusi strategi otomatis di 80+ blockchain dan 2.900+ peluang imbal hasil DeFi. Solusinya

GateNews15jam yang lalu
Komentar
0/400
Tidak ada komentar