أطلقت Google Gemini 3.1 Flash TTS: يدعم 70 لغة وسيناريوهات متعددة لتوجيه المخرّجين، وصوت الذكاء الاصطناعي أكثر طبيعية

ChainNewsAbmedia

أعلن مدير العلاقات مع مطوري الذكاء الاصطناعي في Google، Logan Kilpatrick، في 15 أبريل عن إطلاق Gemini 3.1 Flash TTS — أحدث نموذج لتحويل النص إلى كلام من Google. يدعم هذا النموذج 70 لغة، والتحكم الدقيق على مستوى المخرجين المشهديين (scene direction)، ومستوى المتحدثين، بالإضافة إلى وسم الصوت، وهو متاح حاليًا للاستخدام في مساحة اللعب الخاصة بالصوت ضمن Google AI Studio وفي Gemini API.

الميزات الأساسية الأربعة

يحسّن Gemini 3.1 Flash TTS مقارنةً بسابقه بشكل ملحوظ عبر أربع ترقيات:

المخرج المشهدي (Scene Direction) — يمكنه ضبط سياق الصوت، مثل “الحديث بصوت منخفض في مقهى مزدحم” أو “الإعلان عن أخبار سارة بحماس”، حيث يقوم النموذج بتعديل النبرة وسرعة الكلام والتعبير العاطفي وفقًا للمشهد

التحكم على مستوى المتحدثين (Speaker-Level Specificity) — في حوارات متعددة الأدوار، يمكن تعيين خصائص صوت مختلفة لكل شخصية

وسوم الصوت (Audio Tags) — يدعم إدراج تعليمات لمؤثرات صوتية داخل النص للتحكم بالتوقفات وتغيرات النبرة وتفاصيل أخرى

دعم 70 لغة — توسيع كبير لتغطية اللغات المتعددة، بما في ذلك الصينية

أصوات أكثر طبيعية وأكثر تعبيرًا

وأكدت Google أن هذا النموذج يحقق تقدمًا في طبيعية الصوت. غالبًا ما يتعرض خرج نماذج TTS التقليدية لانتقادات لأنه “يبدو كأنه ذكاء اصطناعي”، وتُحاول Gemini 3.1 Flash TTS تضييق الفجوة مع الصوت البشري عبر تقديم تنوع أكبر في الإيقاع والتعبير العاطفي. وأشار Kilpatrick إلى أن التقدم من Gemini 2.5 إلى 3.1 “واضح للغاية”.

كيف يمكن للمطورين استخدامه

يمكن للمطورين استخدامه بطريقتين:

Google AI Studio الصوتية Playground — اختبار المعاينة مباشرة داخل واجهة الويب لتأثيرات الصوت

Gemini API — التكامل داخل التطبيقات، للاستخدام في سيناريوهات مثل المساعدات الصوتية، والكتب الصوتية، والتوليد التلقائي للـ Podcast، والدعم متعدد اللغات للعملاء

توسيع خط منتجات Gemini بشكل مستمر

يُعد Flash TTS جزءًا من السلسلة التي شهدت إطلاقًا مكثفًا مؤخرًا ضمن عائلة Gemini 3.1. وقبل ذلك كانت Google قد أطلقت Gemini Robotics ER 1.6 (استدلال رؤية الروبوتات)، وTab Tab Tab (تكملة prompt لـ Vibe Coding)، بالإضافة إلى ميزات المعاينة الخاصة بالتصميم. تعمل Google على توسيع Gemini من “نموذج محادثة” ليصبح منصة ذكاء اصطناعي متعددة الوسائط تشمل النص والصوت والرؤية والروبوتات.

هذه المقالة التي قدمت فيها Google Gemini 3.1 Flash TTS: دعم 70 لغة ومخرجين مشهديين، وصوت AI أكثر طبيعية ظهرت لأول مرة على موقع 鏈新聞 ABMedia.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

هونغ كونغ تعلن غدًا الدفعة السادسة من قائمة الشركات الرئيسية

أعلن وزير المالية في هونغ كونغ بول تشان الكشف عن قائمة جديدة من الشركات الرئيسية، ما جذب أكثر من 100 شركة تبلغ قيمتها أكثر من 100 مليار دولار هونغ كونغ في قطاعات مثل علوم الحياة والذكاء الاصطناعي والتكنولوجيا المالية، مشيرًا إلى جاذبية هونغ كونغ للاستثمار الدولي.

GateNewsمنذ 30 د

روبوت هونر Lightning يفوز بماراثون نصف الروبوتات البشرية في بكين 2026 بوقت 50:26

إن روبوت هونر البشري "Lightning" حقق رقمًا قياسيًا جديدًا في ماراثون نصف الروبوتات البشرية في بكين ييتوانغ لعام 2026، وأكمل السباق في 50 دقيقة و26 ثانية، متجاوزًا الرقم القياسي العالمي البشري.

GateNewsمنذ 3 س

سهم Meta يرتفع بنسبة 1.73% بينما تخطط الشركة لتسريح 8,000 وظيفة بدءًا من 20 مايو

تخطط Meta Platforms لخفض حوالي 8,000 وظيفة، أو 10% من قوتها العاملة، بدءًا من 20 مايو، رغم ارتفاع أسعار أسهمها. وتُركّز الشركة، التي تحقق أكثر من $200 billion في الإيرادات، على استثمارات الذكاء الاصطناعي في ظل إعادة هيكلة كبيرة، بما يتماشى مع اتجاهات الصناعة المرتبطة بعمليات التسريح.

GateNewsمنذ 11 س

يذكر تقرير Google السنوي أن Gemini يحقق اعتراضًا في أجزاء من الثانية، ويمنع 99% من إعلانات الاحتيال

ناقش المقال كيف يعزز Google أمان الإعلانات عبر نظامه الخاص بالذكاء الاصطناعي التوليدي Gemini، وأظهر التقرير أن سرعة اعتراض الإعلانات المخالفة قد انخفضت إلى أجزاء من الثانية (ملّيلِي ثانية)، مع معدل اعتراض بلغ 99%. في العام الماضي، قامت Google بإزالة 8.3 مليار إعلان، وأوقفت 24.9 مليون حساب، ما يشير إلى ارتفاع كبير في عدد إعلانات الاحتيال. وأشار خبراء إلى أن هذا صراع بين الذكاء الاصطناعي والذكاء الاصطناعي، وأنه سيتعين على المستقبل التعامل مع تحديات السلوكيات القانونية وغير القانونية التي يسببها الذكاء الاصطناعي.

ChainNewsAbmediaمنذ 13 س

以太坊联合创始人鲁宾:AI 将成为加密的关键转折点,但科技巨头的垄断带来系统性风险

强调以太坊联合创始人约瑟夫·鲁宾,AI 对加密货币行业的变革潜力具有重要意义,同时也警告科技巨头之间的中心化风险。他设想区块链上由 AI 驱动的自主交易,并指出传统金融与 DeFi 的融合正在加速。

GateNewsمنذ 15 س

إيلون ماسك يدفع نحو “شيكات الدخل المرتفع الشامل” باعتبارها الحل النهائي لبطالة وظائف الذكاء الاصطناعي

يدعو إيلون ماسك إلى دخل مرتفع عالمي لمكافحة البطالة الناجمة عن الذكاء الاصطناعي، متصورًا مستقبلًا تتوفر فيه السلع بكثرة وينعدم فيه التضخم. وفي المقابل، يثير خبراء مثل سام ألتمان مخاوف بشأن فقدان الوظائف ويقترحون تدابير لحماية العمال.

Coinpediaمنذ 15 س
تعليق
0/400
لا توجد تعليقات