xAI meluncurkan Voice Agent Builder Beta, Grok Voice melampaui GPT dalam benchmark

XAI4,59%
GROK-1,48%

xAI pada 1 Juli mengumumkan peluncuran Voice Agent Builder Beta, platform pembuatan agen suara AI tanpa kode sama sekali yang memungkinkan pengguna membangun agen suara tingkat perusahaan hanya dalam 2 menit melalui perintah bahasa alami; platform ini menggunakan jalur suara tunggal end-to-end Speech-to-Speech yang terintegrasi erat dengan Grok Voice, dengan tolok ukur yang melampaui GPT.

Benchmark τ-voice Bench: Grok Voice Think Fast 1.0 Melampaui GPT

xAI AI語音代理建置平台 (Sumber: Situs web xAI)

Menurut pengumuman resmi xAI, Grok Voice Think Fast 1.0 menempati peringkat teratas dalam tolok ukur suara τ-voice Bench, secara langsung melampaui Google Gemini 3.1 Flash Live dan OpenAI GPT Realtime 1.5 dalam dua indikator: kecepatan respons dan kemampuan penalaran.

xAI menjelaskan bahwa Grok Voice dilatih menggunakan skenario panggilan nyata yang dirancang sebagai "yang paling sulit", mencakup noise telepon berkualitas rendah, aksen kuat, interupsi pengguna di tengah jalan, dan perintah yang tidak jelas, serta mendukung secara native lebih dari 25 bahasa.

Arsitektur End-to-End Speech-to-Speech: Jalur Suara Tunggal Menggantikan Arsitektur STT+LLM+TTS Tradisional

Penjelasan resmi xAI, sistem layanan pelanggan suara AI perusahaan tradisional harus menghubungkan tiga sistem independen: Speech-to-Text (STT), Large Language Model (LLM), dan Text-to-Speech (TTS). Arsitektur yang dirangkai ini meningkatkan latensi multi-hop, serta meningkatkan tingkat kesalahan dan biaya operasional.

Voice Agent Builder mengadopsi jalur suara tunggal end-to-end Speech-to-Speech yang terintegrasi erat dengan Grok Voice, seluruh proses pemrosesan suara tidak terputus-putus, yang bertujuan mengurangi latensi dan meminimalkan kesalahan perangkaian.

Basis Pengetahuan, Integrasi Alat, Kloning Suara, dan Akses Telepon: Empat Spesifikasi Fitur Inti

Berdasarkan penjelasan fitur resmi xAI, spesifikasi empat modul fitur inti Voice Agent Builder adalah sebagai berikut:

Basis Pengetahuan (Knowledge Base): Mendukung unggah format Word, Excel, PDF, JSON, dll., dapat diatur menjadi Collections yang dibagi antar agen, memastikan konsistensi spesifikasi produk dan kebijakan.

Integrasi Alat (Tools & Connectors): Terintegrasi dengan Kalender Google/Outlook, Pencarian Web, Pencarian X (Twitter), dan Notion; mendukung transfer ke agen manusia, mengakhiri panggilan, dan notifikasi tim real-time.

Suara & Telepon (Voice & Telephony): Menyediakan lebih dari 80 suara bawaan; mendukung kloning suara merek hanya dengan audio 2 menit; dapat memperoleh nomor telepon gratis dari xAI, atau menghubungkan sistem PBX yang ada melalui SIP.

Harga Transparan (Pricing): Biaya API komputasi 0,05 dolar AS per menit, tanpa biaya platform tambahan; saat menggunakan nomor telepon yang disediakan xAI, dikenakan biaya komunikasi tambahan 0,01 dolar AS per menit.

Keamanan Perusahaan: Rekaman Otomatis dan Transkrip, Catatan Penggunaan Alat, dan Pengaturan Batas Percakapan

Menurut pengumuman resmi xAI, Voice Agent Builder dilengkapi dengan mekanisme pemantauan (Observability) dan pagar pengaman (Guardrails) untuk pengguna tingkat perusahaan: setiap panggilan secara otomatis direkam dan menghasilkan transkrip; administrator dapat kapan saja melihat catatan alat yang digunakan AI selama panggilan; dan dapat menetapkan batas percakapan yang ketat, misalnya melarang AI membaca nomor kartu kredit pelanggan, atau melarang diskusi topik politik yang tidak relevan dengan pengguna.

xAI dalam pengumuman resminya menyatakan: "Menilai dengan telinga lebih akurat daripada melihat tolok ukur—bangunlah agen, dan cobalah menelepon dengan alur kerja paling sulit Anda."

Pertanyaan Umum

Berapa biaya komputasi xAI Voice Agent Builder?

Menurut pengumuman resmi xAI, biaya API komputasi adalah 0,05 dolar AS per menit, tanpa biaya platform tambahan; jika menggunakan nomor telepon gratis yang disediakan xAI, dikenakan biaya komunikasi tambahan 0,01 dolar AS per menit.

Bagaimana kinerja Grok Voice Think Fast 1.0 di τ-voice Bench?

Menurut pengumuman resmi xAI, Grok Voice Think Fast 1.0 melampaui Google Gemini 3.1 Flash Live dan OpenAI GPT Realtime 1.5 dalam tolok ukur τ-voice Bench, menempati peringkat teratas dalam dua indikator: kecepatan respons dan kemampuan penalaran.

Di mana xAI Voice Agent Builder saat ini dapat dicoba?

Menurut pengumuman resmi xAI, Voice Agent Builder Beta telah resmi diluncurkan di xAI Console dan terbuka untuk uji coba.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar