XAI Grok lança vozes personalizadas: clonagem de 2 minutos e verificação de identidade em duas etapas

ChainNewsAbmedia

A xAI lançou no dia 2 de maio, no blog oficial, o recurso Grok Custom Voices. Com ele, os usuários só precisam gravar cerca de 1 minuto de voz natural no painel da xAI; o sistema processa tudo em até 2 minutos e gera um modelo de voz personalizado, que pode ser usado tanto para TTS quanto para a Voice Agent API. Junto com o lançamento, também chegaram o modelo Grok 4.3 e a interface do Voice Library, que reúne todos os recursos de voz.

Custom Voices foi projetado com um mecanismo de autenticação de identidade em duas etapas, para impedir clonagem da voz de outras pessoas.

Funcionalidade: 1 minuto de gravação, 2 minutos de geração, integração com TTS e Voice Agent API

O usuário grava cerca de 1 minuto de voz natural no painel da xAI e, em seguida, o fluxo de bastidores conclui, em sequência: (1) autenticação de identidade, (2) processamento de voz, (3) geração do modelo. No total, em até 2 minutos, já é possível obter um modelo de voz utilizável. O Custom Voices herda todos os recursos do TTS, incluindo speech tags (etiquetas de voz), saída multilíngue e streaming via REST e WebSocket; ele pode ser combinado diretamente com os endpoints de TTS da xAI ou com a Voice Agent API para conversas em tempo real com agentes.

O Voice Library lançado em paralelo é uma interface unificada para gerenciar recursos de voz dentro do painel da xAI, permitindo navegar, visualizar e gerenciar todas as vozes criadas pelos usuários e as vozes pré-construídas, evitando dispersão em várias interfaces. A biblioteca de vozes pré-construídas oferece mais de 80 vozes e suporte a 28 idiomas.

Autenticação de identidade em duas etapas: impedir clonagem de voz de terceiros

Antes da geração da voz, o Custom Voices configura duas etapas de autenticação: primeiro, o usuário lê uma frase de verificação e o sistema transcreve a fala em tempo real; segundo, o sistema calcula separadamente o speaker embedding (vetor de características do falante) a partir da frase de verificação e do áudio completo gravado, comparando se ambos pertencem à mesma pessoa. Apenas se as duas etapas forem aprovadas, o processo de geração do modelo de voz é iniciado.

A xAI afirma claramente: os usuários não conseguem clonar a voz usando arquivos de gravação existentes, nem cloná-la a partir da voz de outra pessoa. Esse desenho elimina o cenário de “pegar gravações de palestras públicas de outra pessoa e copiar”, restringindo o escopo de clonagem à única entrada de “gravação imediata feita pelo próprio usuário”. Para observadores atentos ao tema do uso indevido de geração de voz por IA (como fraudes telefônicas e dublagem não autorizada), esse mecanismo é uma resposta concreta da xAI às preocupações de falsificação.

Próximas observações: sincronia com Grok 4.3, ritmo de expansão do Voice Library

O Custom Voices e o modelo Grok 4.3 foram lançados no mesmo dia, e a xAI vinculou “upgrade do modelo + integração completa das ferramentas de voz” ao mesmo anúncio. O próximo ponto de observação é o ritmo de ampliação da biblioteca de vozes pré-construídas do Voice Library, saindo de 80 vozes para além disso, e se o mapa de 28 idiomas consegue ampliar ainda mais a cobertura de línguas menores, como o chinês tradicional. Outro ponto é a publicação de casos concretos de adoção da Voice Agent API, especialmente exemplos de integração em cenários como automação de atendimento ao cliente, gravação de podcasts e serviços multilíngues.

Este artigo “xAI Grok lança Custom Voices: clonagem em 2 minutos, autenticação de identidade em duas etapas” apareceu pela primeira vez em 鏈新聞 ABMedia.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Hut 8 assina contrato de US$ 9,8 bilhões para data centers de IA, com duração de 15 anos, e a ação dispara 36% no pré-mercado

Hut 8 anunciou um contrato de 352 MW na primeira fase do data center de IA de Beacon Point, de 1 GW, no estado de Delaware: duração de 15 anos, valor base de US$ 9,8 bilhões, com aumento anual de 3% e três opções de renovação de 5 anos; se todas forem exercidas, o valor do contrato pode chegar a cerca de US$ 25,1 bilhões. O locatário é um cliente de alto nível de investimento, e o nome ainda não foi divulgado. O caso mostra a transição da Hut 8 da mineração para a construção de infraestrutura de IA; a Beacon Point usa a arquitetura NVIDIA DSX, com 352 MW na fase inicial, e prevê energização no 1º trimestre de 2027, entrega do primeiro prédio no 3º trimestre, além de o parque contar com capacidade de expansão para 1 GW.

ChainNewsAbmedia6h atrás

A Core Scientific adquire a mineradora de Bitcoin Polaris por US$ 421 milhões e expande as operações do data center de IA

De acordo com a The Block, a Core Scientific adquiriu a Polaris DS LLC por aproximadamente US$ 421 milhões hoje (6 de maio), garantindo um contrato de energia de 440 megawatts com a Oklahoma Gas & Electric para expandir seus negócios de hospedagem de IA e de computação de alto desempenho. A instalação da Polaris, localizada em Oklahoma e

GateNews7h atrás

Hut 8 registra US$ 16,8 bilhões de receita de data centers de IA e libera 3.300 BTC no 1T

De acordo com a PRNewswire, a empresa de mineração de Bitcoin Hut 8, listada na Nasdaq, divulgou seus resultados financeiros do 1T de 2026 em 6 de maio, informando que seus dois parques de IA em escala mega geraram US$ 16,8 bilhões em receita de arrendamento. A empresa divulgou cerca de 3.300 BTC (aproximadamente US$ 260 milhões) por meio de uma refinanciamento de empréstimo lastreado em Bitcoin

GateNews10h atrás

Prophet lança mercado de previsão com IA e tranche de negociação ao vivo no valor de US$ 10.000 hoje

De acordo com a MetaversePost, a Prophet lançou hoje (6 de maio) um mercado de previsão com IA, com US$ 10.000 em USDC destinados a negociações ao vivo. Os usuários podem negociar diretamente contra uma contraparte de IA que gera preços baseados em probabilidade para cada mercado, com alguns contratos sendo liquidados em até 24

GateNews11h atrás

WorldClaw lança o WorldRouter com WLFI, oferecendo 300+ modelos de IA a um custo 30% menor

De acordo com a WorldClaw, a empresa lançou o WorldRouter em parceria com a World Liberty Fi, permitindo que os usuários acessem mais de 300 modelos de IA por meio de uma única conta com custos aproximadamente 30% menores do que os preços diretos dos provedores. O WorldRouter serve como o primeiro ponto de entrada para o AgentOS da WorldClaw,

GateNews11h atrás

O lucro do Kakao Pay no 1T dispara 141% com o crescimento dos serviços financeiros

A Kakao Pay, uma provedora sul-coreana de pagamentos móveis, informou que seu lucro líquido no primeiro trimestre subiu 141,5% na comparação anual para 34,7 bilhões de won (US$ 23,8 milhões), de acordo com o comunicado de resultados da empresa. O lucro operacional disparou para 32,2 bilhões de won (US$ 21,9 milhões) ante 4,4 bilhões de won (US$ 2,99 milhão

CryptoFrontier12h atrás
Comentário
0/400
Sem comentários