Google AI 開發者關係負責人 Logan Kilpatrick 於 4 月 15 日宣布推出 Gemini 3.1 Flash TTS — Google 最新的文字轉語音模型。這款模型支援 70 種語言、場景導演(scene direction)、說話者級別的精細控制與音訊標籤,目前已在 Google AI Studio 的音訊 playground 和 Gemini API 中開放使用。
四大核心功能
Gemini 3.1 Flash TTS 相較於前代有四項顯著升級:
場景導演(Scene Direction)— 可以為語音設定情境,例如「在嘈雜的咖啡廳中低聲說話」或「興奮地宣布好消息」,模型會根據場景調整語調、語速和情緒
說話者級別控制(Speaker-Level Specificity)— 在多角色對話中,可以為每個角色設定不同的聲音特徵
音訊標籤(Audio Tags)— 支援在文本中插入音效指令,控制停頓、語氣變化等細節
70 種語言支援 — 大幅擴展多語言覆蓋,包含中文
更自然、更有表現力的聲音
Google 強調這款模型在語音自然度上的進步。傳統 TTS 模型的輸出常被批評為「聽起來像 AI」,Gemini 3.1 Flash TTS 試圖透過更豐富的韻律變化和情緒表達來縮小與人類語音的差距。Kilpatrick 指出,從 Gemini 2.5 到 3.1 的進步「非常顯著」。
開發者如何使用
開發者可透過兩種方式使用:
Google AI Studio 音訊 Playground — 直接在網頁介面中測試和預覽語音效果
Gemini API — 整合至應用程式中,用於語音助理、有聲書、Podcast 自動生成、多語言客服等場景
Gemini 產品線持續擴張
Flash TTS 是 Gemini 3.1 系列近期密集發布的一環。此前 Google 已推出 Gemini Robotics ER 1.6(機器人視覺推理)、Tab Tab Tab(Vibe Coding prompt 補全)和設計預覽等功能。Google 正在將 Gemini 從「聊天模型」擴展為涵蓋文字、語音、視覺、機器人的全模態 AI 平台。
這篇文章 Google 推出 Gemini 3.1 Flash TTS:支援 70 種語言與場景導演,AI 語音更自然 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
ElevenLabs 的 ARR 在 4 個月內飆升至 $500M ,自年末以來成長 43%;D 輪以 BlackRock、NVentures 以及 30+ 位名人收關
根據 Beating,AI 語音平台 ElevenLabs 宣布其年度經常性收入(ARR)在過去 4 個月內飆升至 5 億美元,比 2025 年年底的 3.5 億美元成長 43%。成長動能來自企業採用 AI 語音代理,用於客戶服務、銷售與招募。
The c
GateNews22分鐘前
Elastics 完成一輪 200 萬美元 Pre-Seed 融資,由 Frst 領投
根據 ChainCatcher,Elastics(一款 AI 預測市場運營系統)已完成一輪 200 萬美元的 Pre-Seed 融資。Frst 領投本輪,並獲 ElevenLabs、XBTO、RedStone 等參與。
GateNews59分鐘前
前 Qualcomm 高管 Alex Katouzian 於 5 月 4 日加入 Intel,出任客戶端運算與實體 AI 執行副總裁(EVP)
Intel 於 5 月 4 日宣布,曾在 Qualcomm 任職的資深高管 Alex Katouzian 已加入該公司,擔任執行副總裁兼 Client Computing and Physical AI Group 總經理,並直接向執行長 Chen Lixu 彙報。Katouzian 在 Qualcomm 待了 25 年,最近一次職務為 e
GateNews1小時前
那斯達克上市的 K Wave Media 拋棄比特幣金庫,並將 $485M 重新導向至 AI
那斯達克上市公司 K Wave Media 已放棄其比特幣金庫計畫,並將 4.85 億美元改投人工智慧投資,距離為原本的比特幣計畫募資 5 億美元未滿一年
GateNews1小時前
Nova Intelligence 完成 3150萬美元 A 輪融資,由 Chemistry 牽頭,時間為 5 月 5 日
根據《Fortune》報導,AI 代理平台 Nova Intelligence 於 5 月 5 日完成 3,150 萬美元的 A 輪融資,該輪由 Chemistry 領投。Accel、Conviction 和 SAP.io 也參與了本輪融資。
Nova 的平台可分析、現代化,並為薪資、供應鏈等生成自訂程式碼,並
GateNews1小時前
Cipher Digital 確保 $200M 信貸額度以擴展 AI 與 HPC 資料中心
根據 Globenewswire,Cipher Digital(納斯達克上市的比特幣礦商)從全球金融機構取得 2 億美元的循環信貸額度,以提升流動性並加速其 AI 與高性能運算(HPC)資料中心平台的擴張。該公司公布第 1 季
GateNews2小時前