A xAI lançou no dia 2 de maio, no blog oficial, o recurso Grok Custom Voices. Com ele, os usuários só precisam gravar cerca de 1 minuto de voz natural no painel da xAI; o sistema processa tudo em até 2 minutos e gera um modelo de voz personalizado, que pode ser usado tanto para TTS quanto para a Voice Agent API. Junto com o lançamento, também chegaram o modelo Grok 4.3 e a interface do Voice Library, que reúne todos os recursos de voz.
Custom Voices foi projetado com um mecanismo de autenticação de identidade em duas etapas, para impedir clonagem da voz de outras pessoas.
Funcionalidade: 1 minuto de gravação, 2 minutos de geração, integração com TTS e Voice Agent API
O usuário grava cerca de 1 minuto de voz natural no painel da xAI e, em seguida, o fluxo de bastidores conclui, em sequência: (1) autenticação de identidade, (2) processamento de voz, (3) geração do modelo. No total, em até 2 minutos, já é possível obter um modelo de voz utilizável. O Custom Voices herda todos os recursos do TTS, incluindo speech tags (etiquetas de voz), saída multilíngue e streaming via REST e WebSocket; ele pode ser combinado diretamente com os endpoints de TTS da xAI ou com a Voice Agent API para conversas em tempo real com agentes.
O Voice Library lançado em paralelo é uma interface unificada para gerenciar recursos de voz dentro do painel da xAI, permitindo navegar, visualizar e gerenciar todas as vozes criadas pelos usuários e as vozes pré-construídas, evitando dispersão em várias interfaces. A biblioteca de vozes pré-construídas oferece mais de 80 vozes e suporte a 28 idiomas.
Autenticação de identidade em duas etapas: impedir clonagem de voz de terceiros
Antes da geração da voz, o Custom Voices configura duas etapas de autenticação: primeiro, o usuário lê uma frase de verificação e o sistema transcreve a fala em tempo real; segundo, o sistema calcula separadamente o speaker embedding (vetor de características do falante) a partir da frase de verificação e do áudio completo gravado, comparando se ambos pertencem à mesma pessoa. Apenas se as duas etapas forem aprovadas, o processo de geração do modelo de voz é iniciado.
A xAI afirma claramente: os usuários não conseguem clonar a voz usando arquivos de gravação existentes, nem cloná-la a partir da voz de outra pessoa. Esse desenho elimina o cenário de “pegar gravações de palestras públicas de outra pessoa e copiar”, restringindo o escopo de clonagem à única entrada de “gravação imediata feita pelo próprio usuário”. Para observadores atentos ao tema do uso indevido de geração de voz por IA (como fraudes telefônicas e dublagem não autorizada), esse mecanismo é uma resposta concreta da xAI às preocupações de falsificação.
Próximas observações: sincronia com Grok 4.3, ritmo de expansão do Voice Library
O Custom Voices e o modelo Grok 4.3 foram lançados no mesmo dia, e a xAI vinculou “upgrade do modelo + integração completa das ferramentas de voz” ao mesmo anúncio. O próximo ponto de observação é o ritmo de ampliação da biblioteca de vozes pré-construídas do Voice Library, saindo de 80 vozes para além disso, e se o mapa de 28 idiomas consegue ampliar ainda mais a cobertura de línguas menores, como o chinês tradicional. Outro ponto é a publicação de casos concretos de adoção da Voice Agent API, especialmente exemplos de integração em cenários como automação de atendimento ao cliente, gravação de podcasts e serviços multilíngues.
Este artigo “xAI Grok lança Custom Voices: clonagem em 2 minutos, autenticação de identidade em duas etapas” apareceu pela primeira vez em 鏈新聞 ABMedia.
Related Articles
Hut 8 assina contrato de US$ 9,8 bilhões para data centers de IA, com duração de 15 anos, e a ação dispara 36% no pré-mercado
A Core Scientific adquire a mineradora de Bitcoin Polaris por US$ 421 milhões e expande as operações do data center de IA
Hut 8 registra US$ 16,8 bilhões de receita de data centers de IA e libera 3.300 BTC no 1T
Prophet lança mercado de previsão com IA e tranche de negociação ao vivo no valor de US$ 10.000 hoje
WorldClaw lança o WorldRouter com WLFI, oferecendo 300+ modelos de IA a um custo 30% menor
O lucro do Kakao Pay no 1T dispara 141% com o crescimento dos serviços financeiros