XAI Grok يدعم الأصوات المخصّصة: استنساخ مدته دقيقتان والتحقق من الهوية على مرحلتين

أطلقت xAI ميزة Grok Custom Voices في 2 مايو عبر مدونتها الرسمية، حيث يحتاج المستخدمون فقط إلى تسجيل نحو دقيقة واحدة من الصوت الطبيعي في لوحة تحكم xAI، لتقوم الأنظمة بمعالجة ذلك في غضون دقيقتين وإخراج نموذج صوتي مخصص يمكن استخدامه في واجهة برمجة تطبيقات TTS وVoice Agent API. كما تم إطلاق نموذج Grok 4.3 بالتزامن، إلى جانب واجهة Voice Library التي تجمع جميع موارد الصوت. وقد صُممت Custom Voices أيضًا بآلية تحقق على مرحلتين لمنع نسخ صوت الآخرين.

الميزات: تسجيل لمدة دقيقة واحدة، وتوليد خلال دقيقتين، وتكامل مع TTS وVoice Agent API

يُسجل المستخدمون نحو دقيقة واحدة من الصوت الطبيعي في لوحة تحكم xAI، وتُنجز عملية الخلفية على التوالي: (1) التحقق من الهوية، (2) معالجة الصوت، (3) إخراج النموذج. خلال إجمالي دقيقتين، يمكن الحصول على نموذج صوتي جاهز للاستخدام. ترث Custom Voices جميع قدرات TTS، بما في ذلك speech tags (وسوم الصوت)، وإخراج متعدد اللغات، وكذلك بث REST وWebSocket؛ ويمكن استخدامها مباشرةً مع نقاط نهاية TTS لدى xAI أو Voice Agent API لإجراء محادثات فورية مع وكيل (agent).

أما Voice Library التي تم إطلاقها بالتزامن، فهي واجهة في لوحة تحكم xAI لإدارة موارد الصوت بشكل موحد، تتيح التصفح والمعاينة والإدارة لجميع موارد الصوت التي يصنعها المستخدمون وأصواتهم المُعدة مسبقًا، بما يمنع تشتتها عبر واجهات متعددة. يوفر مكتبة الأصوات المُعدة مسبقًا أكثر من 80 صوتًا، ويدعم 28 لغة.

التحقق على مرحلتين من الهوية: لمنع نسخ صوت الآخرين

قبل توليد الصوت، تضع Custom Voices مرحلتين من التحقق من الهوية. المرحلة الأولى: يقرأ المستخدم جملة تحقق، ثم يقوم النظام بالنسخ الفوري لذلك المقطع الصوتي. المرحلة الثانية: يقوم النظام بحساب speaker embedding (متجهات سمات المتحدث) بشكل منفصل من جملة التحقق ومن التسجيل الكامل، ثم يقارن ما إذا كانا ينتميان إلى الشخص نفسه. لن يتم الانتقال إلى عملية إخراج نموذج الصوت إلا بعد اجتياز المرحلتين.

تصرّح xAI بوضوح بأن المستخدمين لا يمكنهم نسخ الصوت باستخدام ملفات تسجيل موجودة مسبقًا، كما لا يمكنهم نسخ صوت شخص آخر. تستبعد هذه الآلية سيناريو «الحصول على تسجيل لحفل عام لشخص آخر ثم نسخه مباشرةً»، وتحصّر نطاق النسخ في «مدخل واحد يتم فيه تسجيل المستخدم لنفسه في الوقت الفعلي». وبالنسبة للمهتمين بمسألة إساءة استخدام توليد الصوت بالذكاء الاصطناعي (مثل الاحتيال عبر الهاتف والتعليق الصوتي غير المصرح به)، فإن هذه الآلية تُعد ردًا ملموسًا من xAI على مخاوف التزييف.

ملاحظات لاحقة: إطلاق متزامن مع Grok 4.3 وتوسيع الإيقاع في Voice Library

تم إطلاق Custom Voices ونموذج Grok 4.3 في اليوم نفسه، وربطت xAI «ترقية النموذج + استكمال أدوات الصوت بالكامل» في الموجة نفسها من الإعلانات. أما نقطة الملاحظة التالية فهي وتيرة توسيع مكتبة الأصوات المُعدة مسبقًا في Voice Library من 80 صوتًا إلى ما هو أعلى، وما إذا كانت خريطة اللغات ذات إصدار 28 لغة يمكن أن تغطي بشكل أوسع اللغات الصغيرة مثل الصينية التقليدية. كما تتمثل نقطة الملاحظة الأخرى في نشر حالات تبنّي Voice Agent API بشكل محدد، مع أمثلة تكامل خاصة بسيناريوهات مثل أتمتة خدمة العملاء وإنتاج البودكاست وخدمة العملاء متعددة اللغات.

ظهرت هذه المقالة xAI Grok تطلق Custom Voices: نسخ خلال دقيقتين والتحقق على مرحلتين من الهوية لأول مرة على موقع 鏈新聞 ABMedia.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

TCV تقود $160M جولة السلسلة ب لشركة Corgi للتأمين ناشئة

أعلنت شركة Corgi، وهي شركة تأمين أعمال مقرها الولايات المتحدة، في 6 مايو أنها جمعت 160 مليون دولار في جولة تمويل من الفئة B بقيادة TCV بتقييم يبلغ 1.3 مليار دولار، وفقاً لما ذكرته TechCrunch. وتضمنت الجولة أيضاً Kindred Ventures وLeblon Capital وFirst Order Fund. وبهذا يصل إجمالي تمويل Corgi إلى 268

CryptoFrontierمنذ 3 س

B.AI تتجاوز 1.7 مليون مستخدم في 7 مايو وتطلق برنامج مكافآت

وِفقاً لـB.AI، تجاوزت منصة البنية التحتية للذكاء الاصطناعي 1.7 مليون مستخدم في 7 مايو. تركز المنصة، التي تركز على حماية الخصوصية وبنية تحتية لاقتصاد الوكلاء، على تقديم 500 ألف رصيد مجاني للمستخدمين الجدد عند التسجيل، وأسعار بلا أي هامش زيادة عبر جميع النماذج، وخصماً محدود المدة بنظام 1:1

GateNewsمنذ 3 س

Osome يُقلّص 70+ وظيفة، ويحسّن الأرباح قبل الفوائد والضرائب والإهلاك والاستهلاك (EBITDA) بنسبة 50% مع التحول إلى الذكاء الاصطناعي

بحسب موقع Tech in Asia، خفّضت منصة إدارة الشركات Osome، ومقرها سنغافورة، أكثر من 70 وظيفة خلال العامين الماضيين، مع نشر الذكاء الاصطناعي للتعامل مع مهام الامتثال مثل تسجيل المعاملات ومعالجة الفواتير. قال الرئيس التنفيذي Eugenio Ferrante إن الشركة تباطأت في نمو الإيرادات

GateNewsمنذ 6 س

ستفتح شركة شنايدر إلكتريك مركزاً لتدريب جنوب شرق آسيا في ماليزيا هذا العام، إذ خفضت أدوات الذكاء الاصطناعي استهلاك الطاقة بنسبة 2% إلى 3%

تقول رويترز إن شركة شنايدر إلكتريك تخطط لافتتاح مركز تدريب في جنوب شرق آسيا في ماليزيا هذا العام، لمعالجة تزايد الطلب على الطاقة نتيجة التوسع في البنية التحتية لتقنيات الذكاء الاصطناعي في المنطقة. وسيقوم المركز بتدريب الشركاء والعملاء على أنظمة إدارة الطاقة ومعدات مراكز البيانات. شنايدر'

GateNewsمنذ 6 س

هت 8 توقع عقدًا بقيمة 9.8 مليارات دولار لمركز بيانات للذكاء الاصطناعي لمدة 15 عامًا، وسهمها يقفز 36% في تعاملات ما قبل افتتاح البورصة

أعلنت Hut 8 عن عقد إيجار للمرحلة الأولى من مركز بيانات للذكاء الاصطناعي بقوة 352 ميغاواط في ولاية تكساس لدى Beacon Point ضمن منشأة بإجمالي 1GW. تتضمن الصفقة مدة 15 عامًا، وبحد أساس 9.8 مليار دولار، مع زيادة سنوية بنسبة 3% وخيارات ثلاث مرات لتجديد لمدة 5 سنوات. إذا تم تنفيذ جميع الخيارات، فقد تصل قيمة العقد إلى نحو 25.1 مليار دولار. ويأتي المستأجرون ضمن فئة عملاء ذوي استثمار مرتفع وتصنيف ائتماني قوي، ولم يُكشف عن أسمائهم بعد. ويُظهر هذا المشروع انتقال Hut 8 من التعدين إلى شركة لتقديم البنية التحتية للذكاء الاصطناعي، إذ تعتمد Beacon Point على بنية NVIDIA DSX، مع قدرة ابتدائية تبلغ 352 ميغاواط. ومن المتوقع أن يتم تشغيلها في الربع الأول من عام 2027، وتسليم مرافق المرحلة الأولى في الربع الثالث، وتتيح مساحة المجمع قدرة توسع حتى 1GW.

ChainNewsAbmediaمنذ 16 س

استحوذت Core Scientific على مُعدّن بيتكوين Polaris مقابل 421 مليون دولار، لتوسّع عمليات مراكز بيانات الذكاء الاصطناعي

وفقًا لـ The Block، استحوذت Core Scientific على شركة Polaris DS LLC مقابل ما يقارب 421 مليون دولار اليوم (6 مايو)، وذلك بعد تأمين عقد قدرة بقدرة 440 ميغاواط مع شركة Oklahoma Gas & Electric بهدف توسيع أعمالها في استضافة الذكاء الاصطناعي والحوسبة عالية الأداء. يقع مرفق Polaris في أوكلاهوما و

GateNewsمنذ 16 س
تعليق
0/400
لا توجد تعليقات