Сообщение Gate News, 17 апреля — Google представила Gemini 3.1 Flash TTS, усовершенствованную модель преобразования текста в речь с расширенными функциями выражения эмоций и контроля, 15 апреля. Новая модель будет поэтапно внедряться через API для разработчиков, корпоративную платформу Vertex AI и инструменты для совместной работы.
Ключевые возможности модели включают аудиотеги на основе естественного языка для тонкой настройки скорости, интонации и эмоций, а также «Director Mode» для указания сцен и ролей персонажей, чтобы генерировать более нюансированную голосовую подачу. Функция нескольких спикеров позволяет одновременно генерировать диалоги, обеспечивая более естественные сценарии общения, подходящие для подкастов, аудиоконтента и ИИ‑ассистентов. Модель поддерживает более 70 языков и диалектов, отражая региональные акценты и выражения для локализованного голосового опыта по всему миру.
Google подчеркнула производительность и эффективность по стоимости, добившись высоких результатов на бенчмарках слепой оценки людьми, одновременно снижая вычислительные затраты благодаря архитектуре Flash — она предназначена для масштабного корпоративного внедрения. Сгенерированное аудио включает водяной знак SynthID, чтобы идентифицировать контент, сгенерированный ИИ, и бороться с дезинформацией.
Этот шаг отражает усиливающуюся конкуренцию в голосовых интерфейсах. OpenAI объединяет функции реального времени для голоса с разговорным ИИ для взаимодействий, похожих на человеческие, а Meta расширяет инвестиции в ИИ‑персонажей с голосовыми социальными сценариями. Наблюдатели отрасли отмечают, что хотя высокоуровневое актерское мастерство и креативная работа, вероятно, пока останутся в основном ориентированными на людей, повторяющиеся и массовые рынки производства могут постепенно перейти к использованию ИИ в дубляже, рекламе и сегменте аудиокниг.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Megazone Cloud сотрудничает с AWS в рамках программы обучения ИИ в Южной Корее
Megazone Cloud, компания по облачным услугам из Южной Кореи, была выбрана Amazon Web Services 4 мая в качестве операционного партнёра для AWS Agentic AI GameDay в Южной Корее, как говорится в объявлении компании. Программа — это практическое обучающее мероприятие, проводимое Центром инноваций AWS в области генеративного ИИ,
CryptoFrontier8м назад
Сооснователь Solana предупреждает, что ИИ может взломать постквантовую криптографию к моменту Breakpoint 2026
По словам сооснователя Solana Анатолия Яковенко, выступившего на конференции 2026 Solana Breakpoint в Амстердаме, искусственный интеллект представляет для безопасности блокчейна более экзистенциальную угрозу, чем квантовые компьютеры. Яковенко предупредил, что модели ИИ могут использовать тонкие математические паттерны в po
GateNews28м назад
От туалета до производителей приправ: как «разливы» ценности AI-снабжения помогли каким компаниям?
Волна выгод от бума искусственного интеллекта продолжает распространяться: от Nvidia до таких технологических гигантов, как TSMC. А теперь японские компании, производящие унитазы, и продовольственные группы, начавшие с глутамата натрия, незаметно стали скрытыми победителями этой волны ажиотажа вокруг AI-инфраструктуры. Их прорыв высветил ключевую тенденцию: эффект «перетекания» стоимости в AI-сцепочках давно проник в традиционное производство и открывает более разнообразные возможности для трансформации.
Производитель унитазов TOTO: керамические технологии неожиданно попали в спрос на вафельные техпроцессы
Японская компания TOTO — крупный производитель сантехники — известна по всему миру высококачественными крышками для унитазов и работает в керамическом производстве более 40 лет. Однако именно эта, казалось бы, не связанная с технологиями традиционная технология вывела компанию на новую сцену в полупроводниковом процессе.
TOTO недавно объявила, что будет использовать свою экспертизу в керамических технологиях для производства электростатических прижимов (Electrostatic Chuck), применяемых при изготовлении чипов. Как только новость вышла, котировки акций…
ChainNewsAbmedia2ч назад
MediaTek нанимает бывшего руководителя TSMC для расширения направления AI-чипов
Тайваньский разработчик чипов MediaTek назначил бывшего руководителя Taiwan Semiconductor Manufacturing Co (TSMC) Дугласа Ю частным (на неполной ставке) советником 4 мая, сообщает Reuters. Этот шаг поддерживает расширение MediaTek в сегмент AI-чипов и продвижение его технологий упаковки.
Advanced
CryptoFrontier2ч назад
OpenAI сотрудничает с Yubico, чтобы предложить настраиваемые аппаратные ключи безопасности
По данным Yubico, OpenAI сотрудничала со шведской компанией, базирующейся в Стокгольме, производящей защитные ключи, чтобы предлагать на заказ YubiKeys через свою программу Advanced Account Security. Программа нацелена на пользователей с повышенным риском фишинговых атак и захвата аккаунтов.
Комплект включает YubiKey C NFC для мобильных устройств и YubiKey 5 NFC для компьютеров.
GateNews2ч назад
Индия предупреждает о киберрисках после того, как ИИ Mythos от Anthropic нарушил защиту в 83 из 100 тестовых случаев
Согласно The Economic Times, индийское агентство по кибербезопасности недавно выпустило предупреждение высокой степени критичности после того, как ИИ Anthropic Mythos продемонстрировал способность находить десятки тысяч уязвимостей и превращать программные ошибки в эксплуатируемые атаки за считанные минуты.
Unit 42 компании Palo Alto Networks и
GateNews4ч назад