XAI Grok lança vozes personalizadas: clonagem de 2 minutos, verificação de identidade em duas fases

A 2 de Maio, o xAI lançou no seu blogue oficial a funcionalidade Grok Custom Voices, permitindo que os utilizadores gravem cerca de 1 minuto de voz natural no painel de controlo do xAI. O sistema conclui o processamento em 2 minutos, produzindo um modelo de voz personalizado utilizável para TTS e para a Voice Agent API. Em paralelo, foi também lançado o modelo Grok 4.3 e a interface Voice Library, que agrega todos os recursos de voz. O Custom Voices foi ainda concebido com um mecanismo de autenticação de identidade em duas fases, para impedir a clonagem de vozes de terceiros.

Funcionalidade: gravação de 1 minuto, geração em 2 minutos, integração de TTS e Voice Agent API

Os utilizadores gravam cerca de 1 minuto de voz natural no painel de controlo do xAI e, em seguida, o processo em segundo plano conclui, por esta ordem: (1) autenticação de identidade, (2) processamento de voz e (3) produção do modelo. No total, em menos de 2 minutos, é possível obter um modelo de voz utilizável. O Custom Voices herda todas as capacidades do TTS, incluindo speech tags (etiquetas de voz), saída multilingue e streaming via REST e WebSocket; pode ser usado diretamente em conjunto com o endpoint de TTS do xAI ou com a Voice Agent API para conversas em tempo real com agents.

A Voice Library lançada em simultâneo é a interface no painel de controlo do xAI para gerir de forma unificada os recursos de voz, permitindo navegar, pré-visualizar e gerir as vozes personalizadas e as vozes pré-criadas pelos utilizadores, evitando a dispersão por múltiplas interfaces. As bibliotecas de vozes pré-criadas oferecem mais de 80 tipos de vozes e suportam 28 línguas.

Autenticação de identidade em duas fases: para impedir a clonagem de vozes de terceiros

Antes da geração de voz, o Custom Voices define duas barreiras de autenticação: primeiro, o utilizador lê uma frase de verificação e o sistema transcreve imediatamente essa parte do áudio; segundo, o sistema calcula, de forma separada, o speaker embedding (vetor de características do falante) a partir da frase de verificação e da gravação completa, e compara se ambos pertencem à mesma pessoa. Apenas após a passagem das duas fases é que o processo avança para a produção do modelo de voz.

O xAI declara de forma explícita que os utilizadores não conseguem clonar a voz com ficheiros de gravação existentes, nem clonar a voz de outras pessoas. Esta conceção elimina o cenário de uso de “obter gravações de um discurso público de outra pessoa e copiá-las diretamente”, restringindo o âmbito da clonagem de voz ao único ponto de entrada de “gravação imediata feita pelo próprio utilizador”. Para observadores atentos ao tema do abuso da geração de voz por IA (por exemplo, burlas telefónicas e narração com voz não autorizada), este mecanismo constitui uma resposta concreta do xAI às preocupações com falsificação.

Observação posterior: lançamento em simultâneo com Grok 4.3, expansão do ritmo na Voice Library

O Custom Voices e o modelo Grok 4.3 foram lançados no mesmo dia e o xAI atou “upgrade do modelo + completação da linha de ferramentas de voz” ao mesmo ciclo de anúncio. O próximo ponto a observar é o ritmo de expansão da biblioteca de vozes pré-criadas na Voice Library, passando de 80 tipos para mais, e se o mapa de 28 línguas conseguirá abranger ainda mais línguas minoritárias, como o chinês tradicional; outro ponto a observar é a divulgação de casos concretos de adoção da Voice Agent API, especialmente exemplos de integração em cenários como automação de atendimento ao cliente, gravação de podcast e serviços ao cliente multilingues.

Este artigo xAI Grok lança Custom Voices: clonagem em 2 minutos, autenticação de identidade em duas fases aparece pela primeira vez em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A Hut 8 regista 16,8 mil milhões de dólares em receitas de data centers de IA e liberta 3.300 BTC no 1.º trimestre

De acordo com a PRNewswire, a empresa de mineração de Bitcoin cotada na Nasdaq Hut 8 divulgou os resultados financeiros do 1.º trimestre de 2026 a 6 de maio, referindo que os seus dois parques de IA de mega-escala geraram 16,8 mil milhões de dólares em receitas de arrendamento. A empresa libertou aproximadamente 3.300 BTC (cerca de 260 milhões de dólares) através de uma refinanciamento de um empréstimo suportado por Bitcoin

GateNews3h atrás

O Prophet lança um mercado de previsões com IA, com uma tranche de negociação em direto de $10.000 hoje

De acordo com a MetaversePost, a Prophet lançou hoje (6 de maio) um mercado de previsão baseado em IA, com 10 000 dólares em USDC alocados para negociação em direto. Os utilizadores podem negociar diretamente contra uma contraparte de IA que gera preços baseados em probabilidades para cada mercado, com alguns contratos a liquidar dentro de 24

GateNews3h atrás

WorldClaw lança o WorldRouter com WLFI, oferecendo mais de 300 modelos de IA a um custo 30% inferior

Segundo o WorldClaw, a empresa lançou o WorldRouter em parceria com World Liberty Fi, permitindo aos utilizadores aceder a mais de 300 modelos de IA através de uma única conta a custos aproximadamente 30% mais baixos do que os preços do fornecedor direto. O WorldRouter serve como o primeiro ponto de entrada para o AgentOS da WorldClaw,

GateNews4h atrás

O lucro do Kakao Pay no 1.º trimestre dispara 141% com o crescimento dos serviços financeiros

A Kakao Pay, uma empresa sul-coreana de pagamentos móveis, reportou que o seu lucro líquido no primeiro trimestre subiu 141,5% em relação ao ano anterior para 34,7 mil milhões de won (US$23,8 milhões), segundo o comunicado de resultados da empresa. O lucro operacional disparou para 32,2 mil milhões de won (US$21,9 milhões) face a 4,4 mil milhões de won (US$2,99 mil

CryptoFrontier4h atrás

A startup indiana de mercearia Apna Mart corta 10% do efetivo após uma ronda de financiamento

De acordo com o The Economic Times, a startup indiana de entrega de produtos alimentares Apna Mart cortou recentemente cerca de 10% da sua força de trabalho, afetando 35 a 40 empregados, num contexto de automatização impulsionada por IA e de uma mudança da sede de Bengaluru para Gurugram. A empresa disse que os trabalhadores afetados receberiam uma indemnização equivalente a dois

GateNews6h atrás

As empresas indianas de cibersegurança usam IA para reduzir os testes de vulnerabilidades para horas

As empresas indianas de cibersegurança, incluindo Indusface e Astra Security, estão a adoptar agentes de IA construídos com base em grandes modelos de linguagem para acelerar os testes de vulnerabilidades de software, passando de dias ou semanas para horas, segundo o The Economic Times. A mudança reflecte a crescente rapidez dos atacantes e a capacidade emergente das ferramentas de IA.

CryptoFrontier10h atrás
Comentar
0/400
Nenhum comentário