Gate News 消息,4 月 17 日——Google 于 4 月 15 日公布 Gemini 3.1 Flash TTS,这是一款先进的文本转语音模型,具备增强的情感表达与控制特性。新模型将通过开发者 API、企业 Vertex AI 以及协作工具逐步推出。
该模型的核心能力包括基于自然语言的音频标签,用于加快微调速度、控制语调与情感;另配备“导演模式”,可用于指定场景与角色身份,以生成更细腻的语音输出。多说话人功能可实现同时生成对话内容,使对话流程更自然,适用于播客、有声内容以及 AI 助手。该模型支持 70 多种语言和方言,体现了地区口音与表达方式,为全球本地化语音体验提供支持。
Google 强调性能与成本效率,在盲测的人类评估基准上取得了高分,同时通过其 Flash 架构降低了计算成本——该架构面向大规模企业采用进行了设计。生成的音频包含 SynthID 水印,用于识别 AI 生成内容并打击不实信息。
此举体现了语音交互领域竞争的进一步加剧。OpenAI 正将实时语音能力与对话式 AI 结合,以实现类似人类的交互,而 Meta 则在具有语音驱动的社交体验方面扩大对 AI 角色的投入。行业观察者指出,尽管高水平的表演和创意工作目前仍可能由人类主导,但重复性与大规模生产市场可能会在配音、广告和有声读物等领域逐步迎来 AI 采用。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Megazone Cloud 与 AWS 合作开展韩国 AI 培训项目
根据该公司公告,南韩云服务公司 Megazone Cloud 于 5 月 4 日被 Amazon Web Services 选为 AWS Agentic AI GameDay 在韩国的运营合作伙伴。该项目是由 AWS 的生成式 AI 创新中心主导的动手实训活动,
Crypto Frontier52 分钟前
Solana 联合创始人警告:AI 可能在 2026 年 Breakpoint 破解后量子密码学
据 Solana 联合创始人 Anatoly Yakovenko 称,他在 2026 年于阿姆斯特丹举行的 2026 Solana Breakpoint 大会上发言表示,人工智能对区块链安全构成的生存威胁比量子计算机更大。Yakovenko 警告称,AI 模型可能会利用“po”里/在“po”中的细微数学模式
GateNews1小时前
从马桶到调味料商:AI 供应链价值外溢,助攻了哪些公司?
人工智慧浪潮的红利持续蔓延,从辉达到台积电等科技巨头,如今生产马桶的日本公司与一家以味精起家的食品集团,都悄然成为这波 AI 基础建设热潮中的隐形赢家。它们的崛起曝光了一个关键趋势:AI 供应链的价值外溢效应,早已深入渗透至传统制造业,迸发更多元的转型商机。
马桶制造商 TOTO:陶瓷技术意外命中晶圆制程需求
日本卫浴大厂 TOTO 以高品质马桶盖闻名全球,深耕陶瓷制造逾 40 年。然而,就是这项看似与科技毫不相关的传统工艺,让它在半导体制程中找到了全新舞台。
TOTO 日前宣布将利用自身陶瓷技术专业,生产用于芯片制造的静电吸盘(Electrostatic Chuck),消息一出,股价单
鏈新聞abmedia3小时前
联发科聘请前台积电高管以推动 AI 芯片扩展
据 Reuters 报道,台湾芯片设计公司联发科(MediaTek)于 5 月 4 日任命原台积电(TSMC)高管道格拉斯·于(Douglas Yu)为兼职顾问。该举措支持联发科向 AI 芯片市场扩张,并推动其封装技术进步。
先进
Crypto Frontier3小时前
豆包于 5 月 4 日推出三档付费订阅套餐,月费起价 68 元
据 PANews 报道,豆包在 5 月 4 日宣布推出付费订阅分层,以补充其免费服务。三档分别为:标准版,68 元/月(688 元/年);增强版,200 元/月(2,048 元/年);专业版,500 元/月(5,088 元/年)。豆包说
GateNews3小时前
OpenAI 与 Yubico 合作,提供定制硬件安全密钥
据 Yubico 称,OpenAI 与总部位于斯德哥尔摩的安全密钥制造商合作,通过其“高级账户安全”计划提供定制化的 YubiKeys。该计划面向遭受更高风险的网络钓鱼和账户接管攻击的用户。
该套装包括面向移动设备的 YubiKey C NFC 以及一个 YubiKey 5 NFC。
GateNews3小时前