Mensagem do Gate News, 17 de abril — O Google revelou o Gemini 3.1 Flash TTS, um modelo avançado de texto para fala com recursos de expressão emocional e controle aprimorados, em 15 de abril. O novo modelo será disponibilizado gradualmente por meio de APIs para desenvolvedores, Vertex AI corporativo e ferramentas de colaboração.
As principais capacidades do modelo incluem tags de áudio baseadas em linguagem natural para ajustar a velocidade, a entonação e a emoção, além de um “Director Mode” para especificar cenas e papéis de personagens e gerar saídas de voz mais nuances. Um recurso de múltiplos locutores permite gerar diálogos simultâneos, possibilitando fluxos de conversa mais naturais, adequados para podcasts, conteúdos de áudio e assistentes de IA. O modelo suporta mais de 70 idiomas e dialetos, refletindo sotaques e expressões regionais para experiências de voz localizadas globalmente.
O Google destacou desempenho e eficiência de custos, alcançando altas pontuações em benchmarks de avaliação humana cega, enquanto reduzia custos computacionais com sua arquitetura Flash — projetada para adoção empresarial em larga escala. O áudio gerado inclui marca d’água SynthID para identificar conteúdo gerado por IA e combater a desinformação.
A iniciativa reflete a intensificação da concorrência em interfaces de voz. A OpenAI está combinando recursos de voz em tempo real com IA conversacional para interações semelhantes às humanas, enquanto a Meta está expandindo investimentos em personagens de IA com experiências sociais baseadas em voz. Observadores da indústria apontam que, embora atuação em alto nível e trabalhos criativos possam continuar sendo impulsionados por humanos por enquanto, mercados de produção repetitiva e em larga escala podem ver uma adoção gradual de IA em dublagem, publicidade e setores de audiobooks.
Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o
Aviso Legal.
Related Articles
Enquete POLITICO: 45% dos americanos dizem que investimentos em cripto são arriscados demais, 50% confiam mais nos bancos
De acordo com uma pesquisa da POLITICO, 45% dos americanos acreditam que investimentos em criptomoedas não valem o risco, com cerca de 50% afirmando que confiam mais nos bancos tradicionais para proteger seu dinheiro. A pesquisa também descobriu que 44% dos entrevistados acreditam que a inteligência artificial está se desenvolvendo rápido demais,
GateNews7h atrás
A Amazon e a OpenAI ampliam a parceria: modelos entram no Bedrock, e o acordo exclusivo com a Microsoft chega ao fim
A OpenAI anunciou em 3 de maio uma expansão da parceria com os serviços de computação em nuvem da Amazon (AWS), com modelos da OpenAI e agentes de codificação do Codex passando a ser oferecidos aos clientes da AWS via Amazon Bedrock. De acordo com a CNBC, esta expansão é o passo decisivo após o fim, no fim de abril, do contrato de exclusividade em nuvem entre a OpenAI e a Microsoft — uma mudança da OpenAI de “único na nuvem da Microsoft” para uma implantação em múltiplas nuvens. A AWS, no mesmo período, já concluiu a integração inicial dos produtos da OpenAI na plataforma Bedrock.
Contexto: fim do contrato exclusivo OpenAI–Microsoft, com licenças de IP estendidas até 2032
No fim de abril, a OpenAI e a Microsoft fecharam um novo acordo: a estrutura original de “acesso exclusivo da Microsoft aos produtos e ao IP da OpenAI” foi encerrada, Op
ChainNewsAbmedia8h atrás
Pesquisadores Implantam a Tecnologia DPN-LE para Editar Traços de Personalidade de IA, Alterando Apenas 0,5% dos Neurônios
De acordo com a BlockBeats, em 3 de maio, o pesquisador de IA Brian Roemmele divulgou que sua empresa Zero-Human implantou a tecnologia DPN-LE (Dual Personality Neuron Localization and Editing) para ajustar com precisão
GateNews9h atrás
Claude verifica o relógio a cada 15 minutos após ganhar acesso à ferramenta de horário
De acordo com o desenvolvedor Om Patel, a IA Claude começou a verificar o relógio com frequência após ganhar acesso a uma ferramenta de tempo em 3 de maio, com o modelo verificando a cada 15 minutos. A observação destaca que modelos de linguagem grandes antes não tinham percepção de tempo nativa e não sabiam de qual era a hora atual ou
GateNews10h atrás
A Founders Fund encerra seu fundo flagship de US$ 6 bilhões, o maior desde a criação, em 3 de maio
De acordo com a Bloomberg, a Founders Fund concluiu uma rodada de captação para seu mais recente fundo âncora em US$ 6 bilhões em 3 de maio, superando de forma significativa seu fundo anterior de aproximadamente US$ 3,4 bilhões. O fundo, cofundado pelo bilionário Peter Thiel, vai se concentrar em setores de alto crescimento, incluindo inteligência
GateNews10h atrás
Última pesquisa POLITICO: 45% dos americanos dizem que investir em cripto é arriscado demais, e 44% se preocupam com a IA avançando rápido demais
De acordo com uma pesquisa da POLITICO, apesar de as indústrias de IA e de cripto injetarem financiamento político significativo nas eleições intermediárias dos EUA de 2026, o público americano continua em grande parte cético em relação aos dois setores. A pesquisa apontou que 45% dos americanos acreditam que investir em criptomoedas não vale a pena
GateNews11h atrás