يؤدي عاملون في ولاية تاميل نادو (الهند) مهامهم اليومية مثل تقطيع المانغو وربط الأحذية باستخدام كاميرات مثبتة على عصابات الرأس، مقابل أجر يقارب 2.40 دولار للساعة لتوفير بيانات تدريب لتطوير روبوتات تعمل بالذكاء الاصطناعي. تُعالَج هذه اللقطات، المعروفة باسم الفيديو الانغماسي (egocentric video)، من شركات مثل Objectways، التي تأسست على يد الرئيس التنفيذي Ravi Shankar، وتزوّد عملاء تقنيين في الولايات المتحدة، من بينهم Amazon. تتوقع Goldman Sachs أن يصل سوق الروبوتات الشبيهة بالبشر إلى 38 مليار دولار بحلول 2035، ما يعزز الطلب على هذا النوع من البيانات المرتبطة بسياقات البشر. وقد أثارت هذه الممارسة جدلاً حول خصوصية العاملين والمساواة في الأجر، إذ تغذي العمالة منخفضة التكلفة في الهند منتجات روبوتات عالية الهامش في الولايات المتحدة.
يَصوّر العاملون مهامهم اليومية لتوليد بيانات تدريب للذكاء الاصطناعي
في جنوب الهند، يسجّل أفراد أنفسهم وهم يؤدون أنشطة اعتيادية — تقطيع المانغو، وربط الأحذية، وصنع القهوة — باستخدام كاميرات الهواتف الذكية المثبتة على رؤوسهم. وتلتقط مقاطع الفيديو من منظور الشخص الأول كيفية تحرك اليدين أثناء أداء المهام، وتُسند النية والحركة والبيئة في تدفق واحد. يُفضّل هذا النوع من الفيديو الانغماسي لدى مطوري الذكاء الاصطناعي لأنه يعلّم الروبوتات التقليد دون الحاجة إلى ترميز خطوة بخطوة. يحصل العاملون على ما يقارب 2.40 دولار للساعة مقابل تسجيل هذه المهام المنزلية ومهام العمل. ومن الأمثلة المذكورة في المصدر: Nagireddy Sriramyachandra، الذي يصوّر تقطيع المانغو في تاميل نادو.
Objectways تزود الفيديو الانغماسي لعملاء تقنيين في الولايات المتحدة
تعمل Objectways، وهي شركة لتصنيف البيانات، بقيادة Ravi Shankar مؤسساً لها، كحلقة مركزية في سلسلة توريد بيانات تدريب الذكاء الاصطناعي. يصوّر الموظفون مئات المهام الدقيقة داخل منازل مُحضّرة وتجهيزات مصنع محاكية، ثم يقوم الزملاء بتعليق الإطارات وتحويلها إلى خطوات قابلة للقراءة بواسطة الآلة. ووفقاً للشركة، يتم تسليم المخرجات إلى عملاء تقنيين في الولايات المتحدة يبنون روبوتات منزلية وأنظمة للمستودعات، بما في ذلك شركات مثل Amazon. يعتمد نموذج العمل على إنتاج كميات كبيرة من بيانات سلوك واقعية ونظيفة لتدريب الروبوتات الشبيهة بالبشر والروبوتات المتنقلة. تتوقع Goldman Sachs أن الإنفاق المرتبط بالروبوتات الشبيهة بالبشر قد يتجاوز 38 مليار دولار بحلول 2035، بافتراض انخفاض تكاليف الأجهزة واستمرار تحسن نماذج الذكاء الاصطناعي العامة.
مخاوف الخصوصية والمساواة في الأجر تبرز من ممارسات جمع البيانات
يُثير تسجيل الأنشطة اليومية في المطابخ وغرف المعيشة وأرضيات المصانع أسئلة حول الخصوصية. يتجنب بعض العاملين تصوير غرف النوم أو أفراد الأسرة، بينما يسعى آخرون إلى وضع قواعد واضحة بشأن الاحتفاظ بالبيانات والترخيص وما إذا كانت اللقطات ستُستخدم في نماذج تجارية مستقبلية دون تعويض إضافي. وتُعد المساواة في الأجر أيضاً مصدر قلق: إذ جذب الفجوة بين الروبوتات المدربة على عمالة منخفضة التكلفة والمنتجات المتميزة التي تُباع في الولايات المتحدة تدقيقاً من صانعي السياسات والعملاء. وتتوازى مسألة ما إذا كانت مجموعات البيانات التي تمكّن من تحقيق هوامش مرتفعة في مجال الروبوتات ينبغي أن تقود إلى أجور أعلى للمساهمين مع نقاشات سابقة حول خدمات طلب الركوب وإدارة المحتوى. ومع ذلك، تستمر الفرق في الولايات المتحدة في طلب أيدٍ متنوعة وإضاءة وبيئات مختلفة لتجنب نماذج ذكاء اصطناعي هشّة، ما يحافظ على الطلب على هذه اللقطات.
الأسئلة الشائعة
ما المهام التي يصوّرها العاملون في تاميل نادو لتدريب الذكاء الاصطناعي؟
يصوّر العاملون أنشطة يومية اعتيادية مثل تقطيع المانغو وربط الأحذية وصنع القهوة باستخدام كاميرات مثبتة على عصابات الرأس. وتُستخدم اللقطات لتدريب روبوتات تعمل بالذكاء الاصطناعي لأداء مهام مماثلة.
كم يتقاضى العاملون مقابل تسجيل الفيديو الانغماسي؟
يحصل العاملون على ما يقارب 2.40 دولار للساعة مقابل تصوير مهام منزلية ومهام عمل توفر بيانات تدريب لتطوير روبوتات تعمل بالذكاء الاصطناعي.
ما مخاوف الخصوصية التي تنشأ من جمع هذه البيانات؟
غالباً ما تأتي اللقطات من المطابخ وغرف المعيشة وأرضيات المصانع، ما يثير أسئلة حول الاحتفاظ بالبيانات والترخيص وما إذا كان سيتم استخدام المحتوى في نماذج تجارية مستقبلية دون تعويض مستمر للعاملين. ويتجنب بعض العاملين تصوير غرف النوم أو أفراد الأسرة.