قدّمت Google DeepMind نموذجًا أساسيا جديدًا للروبوتات بعنوان Gemini Robotics ER 1.6، حيث يشير ER إلى Embodied Reasoning (الاستدلال المتجسّد). يحقق هذا النموذج أفضل مستوى حالي (SOTA) في الاستدلال البصري والاستدلال المكاني، وقد أصبح متاحًا عبر Gemini API. أعلن المسؤول عن العلاقات مع مطوري Google، لوجان كيلباتريك، هذا الخبر عبر وسائل التواصل الاجتماعي. (المصدر)
ما هو Embodied Reasoning؟
يشير Embodied Reasoning إلى قدرة نماذج الذكاء الاصطناعي على فهم العالم المادي والاستدلال فيه. وبخلاف نماذج اللغة التقليدية، يحتاج نموذج الاستدلال المتجسّد إلى التعامل مع مواضع الأجسام في الفضاء ثلاثي الأبعاد، وأشكالها، وموادّها، وعلاقات تفاعلها الفيزيائي. تم تحسين Gemini Robotics ER 1.6 خصيصًا لمثل هذه المهام، ما يساعد الروبوتات على فهم البيئة المحيطة بدقة أكبر واتخاذ قرارات مناسبة بخصوص الإجراءات.
القدرات الأساسية
تتركز المزايا الرئيسية لـ Gemini Robotics ER 1.6 على بُعدين:
القدرة الشرح الاستدلال البصري القدرة على التعرف على الأشياء من الصور ومقاطع الفيديو، وفهم بنية المشهد، واتخاذ القرار بناءً عليها الاستدلال المكاني فهم المواضع النسبية والمسافات والاتجاهات للأجسام في الفضاء ثلاثي الأبعاد، مع دعم تخطيط عمليات معقدة
يؤدي الجمع بين هاتين القدرتين إلى تمكين الروبوت من التعامل مع مهام أكثر تعقيدًا في العالم الواقعي. على سبيل المثال، في بيئات التخزين، يحتاج الروبوت إلى تحديد الأشياء المختلفة من حيث الشكل في الوقت نفسه، وحساب أفضل زاوية للإمساك وأفضل موضع لوضعها — وهي حالة تتفوق فيها Gemini Robotics ER 1.6.
استخدام Gemini API
على عكس العديد من نماذج الروبوتات في الماضي التي ظلت فقط ضمن مرحلة الأبحاث، أصبح بإمكان الوصول إلى Gemini Robotics ER 1.6 عبر Gemini API. وهذا يعني أن المطورين وشركات الأجهزة يمكنهم دمج هذا النموذج مباشرة في أنظمة الروبوتات الخاصة بهم، دون الحاجة إلى تدريب النموذج من الصفر.
كما يؤدي فتح واجهة API إلى خفض عتبة تطوير أنظمة ذكاء اصطناعي للروبوتات. في السابق، كان تطوير نظام روبوتات يتمتع بقدرات الاستدلال البصري والمكاني يتطلب جمعًا كبيرًا للبيانات وأعمال تدريب للنماذج. أما الآن، يمكن للمطورين التركيز على تطوير تصميم العتاد وحالات الاستخدام، وترك قدرات الاستدلال الأساسية إلى Gemini Robotics ER 1.6.
خطة Google في مجال ذكاء الروبوتات
يعد Gemini Robotics ER 1.6 أحدث إنجاز من Google DeepMind في مجال الروبوتات. بدءًا من RT-2 المبكر وحتى سلسلة Gemini Robotics الحالية، واصلت Google توسيع قدرات نماذج اللغات الكبيرة إلى التفاعل مع العالم المادي. يعمل إصدار ER 1.6 على تحسين دقة الاستدلال بشكل أكبر مقارنة بالإصدارات السابقة، ويتميز بشكل خاص بالأداء الأفضل في السيناريوهات التي تتطلب عمليات دقيقة للغاية.
مع دخول صناعة الروبوتات إلى مرحلة نمو جديدة، ستصبح النماذج الأساسية التي تمتلك قدرات قوية في الاستدلال البصري والمكاني بنية تحتية محورية. لمعرفة المزيد عن تطور منظومة Gemini، يمكنك الرجوع إلى الدليل الشامل لـ Gemini.
هذه المقالة: Google تطلق Gemini Robotics ER 1.6: نموذج روبوتات SOTA، بارع في الاستدلال البصري والمكاني، ظهرت لأول مرة على موقع سلسلة الأخبار ABMedia.
مقالات ذات صلة
روبوت هونر Lightning يفوز بماراثون نصف الروبوتات البشرية في بكين 2026 بوقت 50:26
سهم Meta يرتفع بنسبة 1.73% بينما تخطط الشركة لتسريح 8,000 وظيفة بدءًا من 20 مايو
يذكر تقرير Google السنوي أن Gemini يحقق اعتراضًا في أجزاء من الثانية، ويمنع 99% من إعلانات الاحتيال