Google lanza Gemini 3.1 Flash TTS con mayor expresión emocional y capacidades de múltiples hablantes

Mensaje de Gate News, 17 de abril — Google presentó Gemini 3.1 Flash TTS, un modelo avanzado de texto a voz con funciones de expresión emocional y control mejoradas, el 15 de abril. El nuevo modelo se irá implementando de forma progresiva mediante APIs para desarrolladores, Vertex AI empresarial y herramientas de colaboración.

Las capacidades principales del modelo incluyen etiquetas de audio basadas en lenguaje natural para ajustar la velocidad, la entonación y la emoción, además de un “Modo Director” para especificar escenas y funciones de los personajes y generar salidas de voz más matizadas. Una función de múltiples hablantes permite generar diálogos simultáneos, posibilitando flujos de conversación más naturales adecuados para podcasts, contenido de audio y asistentes de IA. El modelo admite más de 70 idiomas y dialectos, reflejando acentos y expresiones regionales para experiencias de voz localizadas en todo el mundo.

Google enfatizó el rendimiento y la eficiencia en costos, logrando puntuaciones altas en puntos de referencia de evaluación humana a ciegas mientras reducía los costos computacionales mediante su arquitectura Flash, diseñada para la adopción a gran escala en empresas. El audio generado incluye marcas de agua SynthID para identificar contenido generado por IA y combatir la desinformación.

El movimiento refleja una competencia cada vez más intensa en interfaces de voz. OpenAI combina funciones de voz en tiempo real con IA conversacional para interacciones similares a las humanas, mientras que Meta amplía sus inversiones en personajes de IA con experiencias sociales basadas en voz. Los observadores de la industria señalan que, si bien por ahora el alto nivel de actuación y el trabajo creativo pueden seguir estando impulsados por humanos, los mercados de producción repetitiva y a gran escala podrían ver una adopción gradual de IA en doblaje, publicidad y sectores de audiolibros.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

R0AR avanza a la ronda final del PitchFest Consensus 2026, se queda por poco fuera del Top 20

Según MetaversePost, R0AR avanzó a la ronda final de selección del CoinDesk's Consensus 2026 PitchFest el 4 de mayo, quedándose por poco fuera del top 20 de las startups seleccionadas para presentaciones en vivo. El innovador de Web3 y IA fue evaluado junto con startups de alto potencial de todo el mundo en uno de los m

GateNewsHace7m

Musk busca un acuerdo de 150 mil millones de dólares con OpenAI antes del juicio; fracasan las conversaciones de acuerdo

Según un escrito judicial, Elon Musk se puso en contacto con el presidente de OpenAI, Greg Brockman, el 26 de abril, dos días antes de que comenzara su juicio en el tribunal federal de Oakland, para explorar una solución amistosa. Cuando Brockman sugirió que ambas partes retiraran sus demandas, Musk respondió con amenazas, diciéndole a Brockman: “Para el final

GateNewsHace16m

Cursor acepta la oferta de adquisición de SpaceX de 60 mil millones de dólares, pero no hará una alianza con xAI en modelos de codificación

Según The Information, Cursor ha aceptado una oferta condicional de adquisición por 60 mil millones de dólares de SpaceX, aunque el acuerdo aún no se ha finalizado. La empresa actualmente no tiene planes de colaborar con la unidad de IA de SpaceX, xAI, para desarrollar modelos de codificación. En cambio, Cursor se centra en optimizarlo

GateNewsHace38m

Haun Ventures cierra un fondo de 1 billón el 4 de mayo, y divide el capital entre inversiones cripto en etapas tempranas y tardías

Según Bloomberg, Haun Ventures completó una ronda de recaudación de fondos de 1 billón de dólares el 4 de mayo, con 500 millones destinados a inversiones en etapa inicial y 500 millones a inversiones en etapa avanzada. El fondo desplegará capital durante los próximos dos a tres años, con foco en startups de criptomonedas y blockchain mientras se expande

GateNewshace1h

OpenAI recauda $4 mil millones para un emprendimiento conjunto de despliegue, valorado en $10 mil millones

Según BlockBeats, el 4 de mayo, OpenAI recaudó más de $4 mil millones de dólares para establecer una nueva empresa conjunta enfocada en ayudar a las empresas a adoptar su software de inteligencia artificial. La empresa, llamada The Deployment Company, está respaldada por 19 inversores, incluidos TPG Inc., Brookfield Asset Management,

GateNewshace2h

¿Por qué algunas personas creen que la IA cambiará el mundo, mientras otras piensan que será algo normal? Los dos diagnósticos de Karpathy

Karpathy 指ica que la brecha de percepción de la IA proviene de dos diagnósticos: 1) solo se han utilizado modelos gratuitos o versiones antiguas, incapaces de reflejar el rendimiento de los modelos agentic más avanzados; 2) la mejora de capacidades solo es significativamente notable en ámbitos altamente técnicos y, además, se manifiesta de forma asimétrica. Esto hace que los usuarios que pagan y los lectores generales vean fenómenos distintos, creando un malentendido mutuo entre mundos paralelos. La lección para los lectores de Taiwán es que, al usar efectivamente los modelos más avanzados para completar tareas de producción y verificar los fundamentos de los juicios, se puede evitar ser arrastrado por los mitos de los medios.

ChainNewsAbmediahace2h
Comentar
0/400
Sin comentarios