كشفت مجموعة Qwen التابعة لشركة Alibaba النقاب عن حزمة Qwen-Robot Suite يوم الثلاثاء، وهي مجموعة من ثلاثة نماذج أساس مصممة لتشغيل الملاحة الروبوتية، والعمليات اليدوية، ومحاكاة العالم المبني على الفيزياء من خلال حزمة برمجية موحدة. أعلنت الشركة عن الحزمة عبر تويتر في 16 يونيو 2026، مقدمةً التقنية على أنها ما تسميه "حزمة كاملة للذكاء المتمثل". طورت Alibaba النماذج لمعالجة تحدٍّ محوري في الروبوتات: إذ بينما تعتمد وكلاء الذكاء الاصطناعي حالياً على النماذج اللغوية الكبيرة لاتخاذ القرار، تحتاج الروبوتات المادية إلى أنظمة ذكاء اصطناعي توليدي قادرة على التعامل مع أنماط الفشل القائمة على الفيزياء، بدلاً من التفكير المعتمد على الأوامر. تمثل الإطلاق تجسيداً لاستراتيجية Alibaba للتكامل العمودي الممتدة عبر الشرائح والبنية السحابية ونماذج الذكاء الاصطناعي والتطبيقات، حيث تُعد الروبوتات أصدق تعبير مادي عن تطور الذكاء المتمثل في الصين.
تتألف حزمة Qwen-Robot Suite من ثلاثة نماذج أساس، يتولى كل منها جانباً مميزاً من الذكاء الروبوتي. يتولى Qwen-RobotNav مهام التنقل والملاحة. يعالج Qwen-RobotManip عمليات المناولة والتفاعل الجسدي مع الأشياء. يحاكي Qwen-RobotWorld الفيزياء التي تمكّن كلاً من الملاحة والمناولة. ووفقاً لـ Alibaba، يعمل كل نموذج بشكل مستقل مع تكوين حزمة برمجية متماسكة عند دمجهما. تصف الشركة البنية بأنها طبقة نظام تشغيل للروبوتات وليس مجرد عتاد.
يوحد Qwen-RobotNav خمس مهام ملاحة ضمن نموذج واحد: اتباع التعليمات، الملاحة من نقطة إلى هدف، البحث عن الأشياء، تتبع الهدف، والقيادة الذاتية. يعرض النموذج واجهة قابلة للضبط بميزانية رمزية يمكن تكوينها، وتلاشي زمني، وأوزان لكل كاميرا يمكن للـ planner إعادة تهيئتها أثناء التشغيل. دربت Alibaba النموذج على 15.6 مليون عينة مع إجراء عشوائية عبر جميع المعلمات.
يعالج Qwen-RobotManip تحدي تمثيلات الأفعال غير المتوافقة عبر منصات روبوتية مختلفة. تعمل ذراع Franka عبر زوايا المفاصل، بينما يمثل روبوت ALOHA الأفعال من خلال موضع المِقبَض واتجاهه. تستخدم الروبوتات الشبيهة بالبشر إحداثيات للجسم بالكامل. قامت Alibaba بتوليف نحو 38,100 ساعة من بيانات التدريب من مجموعات بيانات روبوتية مفتوحة المصدر ومقاطع فيديو بشرية لربط مساحات الأفعال غير المتوافقة.
يعمل Qwen-RobotWorld كنموذج عالم فيديو مشروط باللغة، يعامل اللغة الطبيعية كواجهة فعل عالمية. يعالج النموذج أوامر مثل "التقط الكوب الأحمر واسكب الماء على الزهرة" عبر أنواع روبوتات مختلفة، بما في ذلك المشابك، والمركبات الذاتية القيادة، ووكلاء الملاحة المتنقلة. يمتد corpus Embodied World Knowledge على 8.6 مليون زوج فيديو-نص بإجمالي 200 مليون إطار عبر سيناريوهات المناولة، والقيادة الذاتية، والملاحة الداخلية، ونقل المهام من البشر إلى الروبوتات.
حقق Qwen-RobotNav نسبة نجاح 76.5% في VLN-CE RxR، وهو معيار للملاحة القائمة على الرؤية واللغة في بيئات العالم الحقيقي. كما وصل النموذج إلى 90% في أداء التتبع على EVT-Bench، الذي يقيّم قدرة الوكيل على متابعة الأهداف المتحركة بشكل متسق.
يحتل Qwen-RobotManip المركز الأول في RoboChallenge Table30-v1، متفوقاً على المقاربات السابقة بنسبة 20%. ويعود أداء النموذج إلى نهجه الذي يركز أولاً على مواءمة التدريب عبر اختلاف تجسيدات الاستخدام.
يتصدر Qwen-RobotWorld في EWMBench وDreamGen Bench، وهما معياران يقيّمان ما إذا كانت نماذج العالم تتنبأ وتُنتج بيئات فيزيائية واقعية. يتفوق النموذج على جميع نماذج open-source على WorldModelBench وPBench. وتذكر Alibaba أن النموذج سجل درجة مثالية في اختبارات الالتزام بالفيزياء التي تغطي قوانين نيوتن، وحفظ الكتلة، وديناميكيات الموائع، والجاذبية.
درّبت Alibaba Qwen-RobotNav على 15.6 مليون عينة مع عشوائية عبر معلمات الملاحة. لم تكشف الشركة عن مجموعات البيانات المصدر المحددة لتدريب الملاحة.
وبالنسبة إلى Qwen-RobotManip، قامت Alibaba بتوليف نحو 38,100 ساعة من بيانات التدريب من مجموعات بيانات روبوتية مفتوحة المصدر ومقاطع فيديو بشرية. وقد ذكرت الشركة أنها لم تعتمد على جمع بيانات مملوك لإجراء تدريب نموذج المناولة.
يحتوي corpus Embodied World Knowledge الخاص بـ Qwen-RobotWorld على 8.6 مليون زوج فيديو-نص تمتد عبر 200 مليون إطار. ويتضمن الـ corpus 5.9 مليون عينة من المناولة تغطي 1,300+ مهارة عبر 20+ أشكال مورفولوجية للروبوتات. تأتي بيانات القيادة الذاتية من مجموعات Waymo وNVIDIA PhysicalAI-AD وBench2Drive. تستمد بيانات الملاحة الداخلية من VLNVerse. أما بيانات نقل المهام من البشر إلى الروبوتات فتغطي 14 ذراع روبوت.
صرحت Alibaba بأن نشر الروبوتات في العالم الحقيقي لا يزال على بعد سنوات. وقد أقرت الشركة بوجود فجوة بين بيئات العرض الخاضعة للسيطرة وبين التشغيل الموثوق في العالم الحقيقي. تعد معايير المحاكاة RoboCasa365 وLIBERO-Plus وRoboTwin-Clean2Rand، وليست سيناريوهات نشر واقعية. ويُدخل نشر العالم الحقيقي ضوضاء في الحساسات، وانحرافاً في المشغلات، وحالات طرفية، وهي تحديات يعترف بها فريق Alibaba بوصفها مستمرة.
تم تصميم النماذج كأنظمة برمجية للتشغيل على عتاد من مصنّعين، بما في ذلك AgileX وFranka وUniversal Robots وUnitree. لم تكشف Alibaba عن التسعير أو جداول زمنية محددة للنشر، أو عن أي عملاء سيحصلون على الوصول بخلاف برامج التجربة.
ماذا أعلنت Alibaba في 16 يونيو 2026؟
أعلنت مجموعة Qwen التابعة لشركة Alibaba حزمة Qwen-Robot Suite يوم الثلاثاء، 16 يونيو 2026، وتتكون من ثلاثة نماذج أساس: Qwen-RobotNav للملاحة، وQwen-RobotManip للمناولة، وQwen-RobotWorld لمحاكاة عالم مبني على الفيزياء. وقد وضعت الشركة الحزمة كحزمة برمجية موحدة للذكاء المتمثل في الروبوتات.
ما نتائج الاختبارات المعيارية التي حققتها نماذج Qwen-Robot؟
حقق Qwen-RobotNav نسبة نجاح 76.5% في VLN-CE RxR و90% في EVT-Bench. ويحتل Qwen-RobotManip المركز الأول في RoboChallenge Table30-v1، متفوقاً على المقاربات السابقة بنسبة 20%. يتصدر Qwen-RobotWorld في EWMBench وDreamGen Bench وWorldModelBench وPBench ضمن نماذج open-source، مع درجات مثالية في اختبارات الالتزام بالفيزياء.
متى سيتم نشر نماذج Qwen-Robot في روبوتات العالم الحقيقي؟
صرحت Alibaba بأن نشر الروبوتات في العالم الحقيقي لا يزال على بعد سنوات. ولم تكشف الشركة عن جداول زمنية محددة للنشر أو التسعير، أو عن أي عملاء سيحصلون على الوصول بخلاف برامج التجربة.
أخبار ذات صلة
قدّمت SpaceX نموذج 8-K يوضح تفاصيل استخدام عائدات الاكتتاب العام للاستثمار في الذكاء الاصطناعي والأقمار الصناعية
تتعاون Cottonia مع Matrix لدمج تحليلات الذكاء الاصطناعي على BNB Chain
الرئيس التنفيذي لشركة Qualcomm: عملاء الذكاء الاصطناعي سيستبدلون التطبيقات مع إطلاق أكثر من 40 جهازًا جديدًا
VARA تطلب من شركات العملات الرقمية في دبي تتبّع القوائم السوداء لمنظمة FATF ضمن إرشادات مكافحة غسل الأموال لعام 2026
أثبت نموذج Rio 3.5 من IplanRIO جدواه باعتباره دمجًا موزونًا (Weight Merge) من فئة Nex في نزاع حول الإسناد