Керівник із взаємодії з розробниками Google AI Logan Kilpatrick 15 квітня оголосив про запуск Gemini 3.1 Flash TTS — найновішої моделі перетворення тексту на мовлення від Google. Ця модель підтримує 70 мов, точне керування рівнями сценарного спрямування (scene direction), рівнями мовців та аудіомітками; наразі її доступно для використання в аудіо-плейграунді Google AI Studio і в Gemini API.
Чотири основні функції
Gemini 3.1 Flash TTS порівняно з попередником має чотири помітні оновлення:
Сценарне спрямування (Scene Direction) — можна налаштовувати контекст для голосу, наприклад «пошепки говорити в галасливому кафе» або «з ентузіазмом оголосити добрі новини»; модель відповідно до сцени змінює інтонацію, темп і емоцію
Керування на рівні мовця (Speaker-Level Specificity) — у діалогах із кількома персонажами можна для кожного з них задати відмінні голосові характеристики
Аудіомітки (Audio Tags) — підтримує вставлення в текст інструкцій зі звуковими ефектами, керуючи такими деталями, як паузи та зміни манери подачі
Підтримка 70 мов — значно розширює покриття багатомовності, включно з китайською
Природніший і більш виразний звук
Google наголошує на прогресі цієї моделі в природності мовлення. Традиційні моделі TTS часто критикують за те, що їхній результат «звучить як AI». Gemini 1.1 Flash TTS намагається скоротити розрив із людською мовою завдяки більш багатим варіаціям мелодики та емоційного вираження. Kilpatrick зазначив, що прогрес від Gemini 2.5 до 3.1 «дуже помітний».
Як розробникам користуватися
Розробники можуть використовувати двома способами:
Google AI Studio Audio Playground — напряму тестуйте та попередньо переглядайте ефекти мовлення в вебінтерфейсі
Gemini API — інтегруйте в застосунки для таких сценаріїв, як голосові асистенти, аудіокниги, автоматичне створення Podcast, багатомовна служба підтримки тощо
Розширення продуктової лінійки Gemini
Flash TTS — це частина нещодавно розгорнутого циклу інтенсивних релізів у серії Gemini 3.1. Раніше Google вже представила Gemini Robotics ER 1.6 (роботизоване візуальне міркування), Tab Tab Tab (доповнення підказки Vibe Coding) та можливості дизайн-прев’ю. Google розширює Gemini з «чата» до всемодального AI-платформеного, що охоплює текст, мовлення, візію та роботів.
Ця стаття Google: Gemini 3.1 Flash TTS — підтримує 70 мов і сценарне спрямування, AI-голос звучить природніше — вперше з’явилася на ланцюжку новин ABMedia.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
AI поглинає 80% глобальних венчурних інвестицій; у Q1 2026 витягує 242 мільярди доларів: як учасники крипторинку мають реагувати на перерозподіл капіталу
Згідно з повідомленнями, у першому кварталі 2026 року загальний обсяг глобальних венчурних інвестицій майже досягне 300 мільярдів доларів США, з яких компанії, пов’язані з AI, самі на себе припадають приблизно на 242 млрд доларів США, що становить 80% від венчурних інвестицій. Це демонструє, що AI уже став головним фокусом венчурного ринку. Оскільки кошти концентруються в AI, інші напрями, такі як crypto, зазнають витіснення; учасникам ринку потрібно скоригувати стратегії, інтегруючи AI в бізнес ще глибше, і очікувати тенденції до консолідації інфраструктури.
ChainNewsAbmedia2год тому
Поліція Гонконгу застерігає про криптосхему зі «сAI кількісним трейдингом»: жінка втратила HK$7,7 млн
Поліція Гонконгу розкрила аферу з криптовалютою, під час якої жінка втратила 7,7 мільйона HK$ шахраям, що видавали себе за інвестиційних експертів через Telegram, обіцяючи високі прибутки завдяки AI-трейдингу. Поліція застерегла громадськість про ризики, пов’язані з інвестиціями в криптовалюти.
GateNews4год тому
Гонконг оголосить сьомий список ключових підприємств завтра
Фінансовий секретар Гонконгу Пол Чан оголосив про представлення нового списку ключових підприємств, привернувши понад 100 компаній із вартістю понад 100 млрд гонконгських доларів у таких секторах, як науки про життя, ШІ та фінтех, підкресливши привабливість Гонконгу для міжнародних інвестицій.
GateNews7год тому
Робот Lightning від Honor перемагає на напівмарафоні гуманоїдних роботів у Пекіні 2026 з фінішем 50:26
Гуманоїдний робот Honor "Lightning" встановив новий рекорд на напівмарафоні гуманоїдних роботів у Пекіні Yizhuang 2026, завершивши перегони за 50 хвилин 26 секунд, перевершивши світовий рекорд людини.
GateNews10год тому
Акції Meta зростають на 1,73%, поки компанія планує звільнення 8,000 працівників, що стартують 20 травня
Meta Platforms планує скоротити приблизно 8,000 робочих місць, або 10% свого штату, починаючи з 20 травня, попри зростання цін на акції. Компанія, яка має понад $200 мільярдів доходу, зосереджується на інвестиціях в ІІ на тлі суттєвої реструктуризації, узгоджуючись із галузевими тенденціями звільнень.
GateNews18год тому
Звіт Google за рік стверджує, що Gemini досягає перехоплення за мілісекунди, блокуючи 99% шахрайських оголошень
Стаття обговорює, як Google за допомогою своєї генеративної системи штучного інтелекту Gemini посилює безпеку реклами; звіт показує, що швидкість виявлення та блокування порушуваних оголошень скоротилася до мілісекунд, а рівень блокування досяг 99%. Минулого року Google видалив 8,3 млрд рекламних оголошень і призупинив 24,9 млн акаунтів, що демонструє суттєве зростання кількості шахрайських оголошень. Експерти зазначають, що це протистояння між штучним інтелектом і штучним інтелектом; у майбутньому все одно доведеться мати справу з викликами, які приносить AI, зокрема щодо законних і незаконних дій.
ChainNewsAbmedia19год тому