أعلن إيلون ماسك (Elon Musk) في 15 مايو على منصة X أن أحدث خوارزمية لدى X قد تم إصدارها على GitHub. ووفقاً لمستودع xAI xai-org/x-algorithm الذي أتاحته الشركة عبر GitHub، فإن محور الإصدار الحالي هو نظام التوصية الأساسي الذي يقود تدفق “For You” على منصة X. يجمع هذا النظام بين المحتوى داخل المنصة الذي يتابع المستخدم حساباته، والمحتوى خارج المنصة الذي يتم استخراجه من قاعدة محتوى عالمية عبر التعلم الآلي، ثم تُعاد ترتيبه عبر نموذج transformer مبني على بنية Grok.
يأتي هذا المشروع بترخيص Apache 2.0، ويُكتب بشكل رئيسي بلغة Rust وPython؛ وحتى وقت الاستعلام، تُظهر GitHub نحو 21 ألف نجمة (stars) و3,800 عملية نسخ (forks).
For You: Thunder يتعقب المحتوى، وPhoenix يستخرج المحتوى خارج المنصة
وفقاً لملف وصف المستودع (repository)، فإن تدفق For You في X يتكون بشكل أساسي من مصدرين مرشحين للمحتوى.
أولهما هو المحتوى داخل المنصة، ويتولى مسؤولية ذلك مكوّن Thunder. Thunder عبارة عن مخزن تخزين منشورات داخل الذاكرة وخط أنابيب لالتقاط البيانات في الوقت الحقيقي؛ إذ يستهلك من Kafka لإنشاء أحداث إنشاء المنشورات وحذفها، ويتعقب جميع منشورات المستخدمين الأخيرة، ويقدم لمقدمي الطلبات مرشحات محتوى من حساباتهم التي يتابعونها. ويؤكد المستند أن Thunder يمكنه تقديم مرشحات المحتوى داخل المنصة عبر استعلامات بدقة “أجزاء من المليار” من الثانية دون الحاجة إلى الاستعلام عن قواعد بيانات خارجية.
ثانيهما هو المحتوى خارج المنصة، وتتعهد به Phoenix Retrieval. تقوم Phoenix بالبحث في قاعدة المحتوى العالمية عن منشورات قد تثير اهتمام المستخدم، لكنها ليست قادمة من حسابات يتابعها. وفي مرحلة الاسترجاع، تستخدم Phoenix نموذج الأبراج المزدوجة (Two-Tower Model): يقوم User Tower بترميز خصائص المستخدم وسجل التفاعلات في متجه، بينما يقوم Candidate Tower بترميز المنشور المرشح في متجه أيضاً، ثم يتم العثور على المحتوى الأكثر صلة عبر تشابه ناتج عن الضرب النقطي.
يدخل هؤلاء المرشحون إلى Home Mixer، أي طبقة التنسيق لتدفق For You. يتولى Home Mixer مسؤولية الاستعلام عن سياق المستخدم، وجلب المحتوى المرشح، واستكمال بيانات المنشور والمؤلف، وتصفية المحتوى غير المؤهل، واستدعاء نموذج الترتيب، وتطبيق تعديلات على الدرجات، وفي النهاية اختيار المنشورات التي سيتم عرضها في صفحة For You الخاصة بالمستخدم. كما يشير المستند إلى أن Home Mixer يوفر للمستخدمين الخارجيين نقطة نهاية ScoredPostsService عبر gRPC لإرجاع منشورات مرتبة بالفعل إلى مستخدمين محددين.
تُعد بنية Grok قلب نظام التوصيات
أكثر ما لفت الانتباه في هذا الإصدار هو إدخال نظام توصيات X بشكل واضح لبنية Grok.
يشير ملف README في GitHub إلى أن محتوى تغذية For You يتم ترتيبُه بواسطة Phoenix، وPhoenix عبارة عن نموذج transformer مبني على Grok يقوم بتوقع احتمال حدوث تفاعلات لكل منشور، ثم يجري دمج قيم هذه التوقعات بترجيحات لاستخراج الدرجة النهائية. كما يوضح المستند أن تنفيذ transformer داخل هذا المستودع تم نقله من Grok-1 مفتوح المصدر الخاص بـ xAI، مع إجراء تعديلات على سياق استخدامه في نظام التوصيات، مثل إضافة تضمينات إدخال مخصصة وقناع انتباه (attention mask) لعزل المرشحين.
لكن ذلك لا يعني أن X أتاح للنشر النموذج الكامل المستخدم في بيئة الإنتاج. إذ تكتب Phoenix README بوضوح أن هذا الإصدار يقدّم “نسخة مصغرة” (mini version)، بينما يستخدم الإنتاج نموذجاً أكبر بعدد طبقات أكثر وبـ embeddings أوسع نطاقاً؛ كذلك فإن checkpoint النسخة المنشورة تم تجميده كصورة زمنية من عملية تدريب متتابعة، في حين تقوم Phoenix في بيئة الإنتاج بالتدريب المستمر وفق البيانات اللحظية.
تحديث 15 مايو: استدلال طرف-إلى-طرف قابل للتنفيذ، ونموذج Phoenix مصغّر، ونظام مزج الإعلانات
وفقاً لتحديث GitHub، أضاف إصدار 15 مايو عدة مكونات رئيسية.
أولاً، سير عمل الاستدلال طرف-إلى-طرف. إذ إن phoenix/run_pipeline.py الجديد يحل محل run_ranker.py وrun_retrieval.py اللذين كانا منفصلين سابقاً؛ ويمكن استخدام نقطة دخول واحدة لربط تسلسل “الاسترجاع → الترتيب”، كما يعتمد على exported checkpoints لمحاكاة كيفية دمج المرحلتين في بيئة الإنتاج.
ثانياً، مخرجات (artifacts) النماذج قبل التدريب. في هذا الإصدار، يتم نشر mini Phoenix model عبر Git LFS. ويذكر المستند أنه يتضمن 256 بُعداً (embeddings) و4 رؤوس attention وطبقتين transformer، بحجم يقارب 3GB، ما يتيح للمطورين إجراء استدلال جاهز “out-of-the-box” دون الحاجة إلى تدريب النموذج بأنفسهم. كما يذكر Phoenix README أن مجموعة demo corpus المنشورة هي مجموعة بيانات تضم نحو 537 ألف منشور حول موضوعات رياضية مستمدة من نافذة مدتها 6 ساعات، وتُستخدم لعرض مرحلة الاسترجاع.
إضافة إلى ذلك، أضاف المستودع أيضاً خط أنابيب Grox لفهم المحتوى (content-understanding) لمهام مثل اكتشاف البريد المزعج (spam)، وتصنيف فئة المنشور (post-category classification)، وفرض سياسات PTOS (PTOS policy enforcement). كما تمت إضافة نظام مزج الإعلانات لدى Home Mixer، المسؤول عن إدخال الإعلانات في تدفق المعلومات وترتيب مواقعها، مع تضمين تتبع الأمان الخاص بالعلامات التجارية.
نموذج الترتيب يتوقع مرة واحدة 15 نوعاً من التفاعلات، وليس مجرد درجة “ملاءمة” واحدة
نموذج ترتيب Phoenix لا يكتفي بإخراج درجة مجردة “ملاءمة” واحدة؛ بل يتوقع في الوقت نفسه احتمالية حدوث عدة سلوكيات تفاعلية.
وفقاً للوثائق، يتوقع النموذج احتمال وقوع 15 سلوكاً منها: favorite وreply وrepost وquote وclick وprofile click وvideo view وphoto expand وshare وdwell وfollow author، إضافة إلى not interested وblock author وmute author وreport.
بعد ذلك، يقوم Weighted Scorer بدمج هذه احتمالات التفاعل بترجيحات لإنتاج الدرجة النهائية: تُعطى أوزان موجبة للسلوكيات الإيجابية مثل الإعجاب والمشاركة وإرسال المحتوى، بينما تُعطى أوزان سالبة للسلوكيات السلبية مثل الحظر وكتم الصوت والإبلاغ، وذلك لدفع المحتوى الذي قد لا يعجب المستخدم إلى الأسفل.
بعد اكتمال درجات النموذج، يطبق النظام أيضاً تعديلات أخرى. فعلى سبيل المثال، يقوم Author Diversity Scorer بتخفيض درجات المؤلفين المتكررين للحفاظ على تنوع المحتوى داخل تدفق المعلومات؛ بينما يقوم OON Scorer بضبط درجات المحتوى خارج الشبكة (out-of-network)، أي المحتوى غير القادم من حسابات يتابعها المستخدم.
وهذا يعني أن “For You” لدى X ليس مجرد دفع المنشورات الأكثر احتمالاً لنيل الإعجاب إلى الأعلى، بل تفكيك توقعات سلوكيات تفاعل متعددة ثم بناء الترتيب النهائي من خلال تصميم الأوزان. كما يعني ذلك أن حكم القيمة الفعلية للخوارزمية لا يوجد فقط داخل النموذج نفسه، بل أيضاً داخل الأوزان المختلفة وقواعد المعالجة اللاحقة.
عزل المرشحين: ألا تتأثر درجة المنشور بمرشحين آخرين في الدفعة نفسها
من النقاط التي تستحق الانتباه في هذا الإصدار “عزل المرشحين” (Candidate Isolation).
تشير Phoenix README إلى أنه في مرحلة ranking لا يمكن للمرشحات أن تنتبه إلى بعضها بعضاً (لا attend فيما بينها)؛ إذ يجب أن تركز فقط على المستخدم وسجلّه التاريخي. الهدف من هذا التصميم هو ضمان ألا تتغير درجة منشور واحد بسبب كونه وُضع ضمن batch مع أي منشورات أخرى. وبعبارة أخرى، ينبغي أن تعتمد درجة منشور ما على العلاقة بينه وبين المستخدم، وليس على وجود منشورات منافسة بعينها داخل الدفعة نفسها.
وهذا قد يحمل دلالات محتملة أيضاً لصانعي المحتوى. ففي الماضي، كان كثير من عمليات إدارة المجتمعات يرجحون أن وقت النشر يجب أن يتجنب الأحداث الرائجة أو المنشورات عالية التفاعل حتى لا يطغى عليها المحتوى القوي داخل حوض التوصيات. لكن إذا تحقق عزل المرشحين كما توضح الوثيقة، فعلى الأقل على مستوى استدلال النموذج، فلن تتغير درجة منشور منفرد بشكل مباشر بسبب ظهور منشورات قوية أخرى ضمن نفس الدفعة.
ومع ذلك، لا يعني ذلك أن وقت النشر غير مهم تماماً؛ لأن عوامل مثل الاسترجاع الأولي، و”نضارة” المنشور (freshness)، والأوقات التي يكون فيها المستخدم متاحاً على الإنترنت، ومرشحات تصفية المحتوى الذي تمّت مشاهدته بالفعل، والانتباه التنافسي للأحداث الرائجة، ما تزال قد تؤثر في التعرض النهائي.
سردية “بلا سمات بشرية” ما زالت محل جدل: إلى جانب ترتيب النموذج، تبقى القواعد اليدوية موجودة
تدعي xAI في الوثائق أن النظام قد أزال جميع السمات المصممة يدوياً ومعظم القواعد الإرشادية، مع الاعتماد بشكل رئيسي على Grok-based transformer لتعلم الملاءمة من تسلسل تفاعلات المستخدم. كما تسرد الوثيقة خمس نقاط تصميم رئيسية، منها: عدم وجود سمات مصممة يدوياً، وعزل المرشحين في مرحلة الترتيب، وembeddings مبني على التجزئة (hash)، والتنبؤات متعددة السلوكيات، وبنية pipeline قابلة للتركيب.
لكن هذا الادعاء يحتاج إلى تفسير أكثر دقة. إذ يمكن أيضاً ملاحظة، من نفس الوثيقة، أن تغذية For You تخضع قبل الدخول إلى مرحلة الترتيب لعدد كبير من مرشحات ما قبل التقييم (pre-scoring filters)، مثل إزالة المنشورات المكررة، والمنشورات القديمة جداً، ومنشورات المستخدم نفسه، والحسابات المحظورة أو المكتمة، والكلمات الرئيسية المكتمة، والمحتوى الذي تمّت مشاهدته أو ظهر مؤخراً، والمحتوى غير المؤهل للاشتراك. وبعد الترتيب، يتم تطبيق مرشحات ما بعد الاختيار (post-selection filters) مثل الحذف (deletion)، وspam، والمحتوى العنيف الدموي، وتصفية الفروع المكررة ضمن سلاسل المحادثة.
لذلك، فإن القول الأكثر دقة هو: تدعي X أن “ترتيب المرشحين لملاءمة المحتوى” يأتي أساساً من تعلم Grok-based transformer، ولا يعتمد بعد الآن على سمات المحتوى اليدوية التقليدية؛ لكن تدفق For You ككل لا يزال يحتوي على عدد كبير من قواعد المنتج، ومرشحات، وأوزان، وآليات معالجة لاحقة. هذه القواعد نفسها أيضاً تشكل المحتوى الذي يراه المستخدم في النهاية.
تطبيق عملي: كيف تستفيد من خوارزمية X لإدارة الحساب
عملياً، إذا أراد صانعو المحتوى “مجاراة الخوارزمية” لإدارة حسابات X، فالمهم لم يعد مجرد السعي وراء الإعجاب أو إعادة النشر؛ بل فهم أن نظام For You يقيم في الوقت نفسه إشارات تفاعل متعددة. وتشمل الإشارات الإيجابية: مدة التوقف (الاحتفاظ)، والنقر، والرد، وإعادة النشر، واتباع المؤلف، ومشاهدة الفيديو، وتوسيع الصور؛ أما الإشارات السلبية فتشمل: عدم الاهتمام، وكتم الصوت، والحظر، والإبلاغ.
وهذا يعني أن المحتوى لا يمكنه الاعتماد فقط على العناوين المثيرة لخداع النقر، لأن قيام المستخدم بالدخول ثم الانزلاق بسرعة، أو الضغط على “غير مهتم”، أو حتى حظر المؤلف، قد يؤدي في المقابل إلى خفض الأداء التوصي في المراحل اللاحقة.
بالنسبة لمُديري الحسابات، فإن الاستراتيجية الأكثر فاعلية تتمثل في رفع “جودة التفاعل”: يجب أن يجذب المحتوى الانتباه خلال أول ثوانٍ، وأن يسمح المتن للمتابعين بالاستمرار في القراءة، ويمكن تصميم الخاتمة بحيث تشجع الرد الطبيعي أو المشاركة، بدلاً من دفع التفاعل بقوة. وفي الوقت نفسه، وبسبب قيام النظام بضبط تنوع المؤلفين، فإن النشر بكثافة خلال فترة قصيرة قد لا يؤدي إلى تضخيم خطي للتعرض، بل قد يتم تخفيضه بسبب المؤلف نفسه وتخفيف الأثر؛ والأكثر منطقية هو التحكم في إيقاع النشر، بحيث يكون لكل منشور موضوع واضح، وكثافة معلومات كافية، وموقف قابل لإعادة النشر.
وأخيراً، يعني التوصية بالمحتوى خارج المنصة أن الحساب لا يجب أن يعتمد فقط على المعجبين الحاليين؛ فإذا كان المحتوى يتيح لمشاهدين غرباء أن يبقوا ويضغطوا ويتابعوا، فهناك فرصة لدفعه إلى حوض أكبر من تدفق For You. لكن الشرط هو تجنب محتوى مزارع منخفض الجودة، والمحتوى المتكرر، والتلاعب المفرط المثير للجدل، لأن هذه السلوكيات إذا أدت إلى كتم الصوت أو الحظر أو الإبلاغ، تكون العقوبة التي تطبقها الخوارزمية غالباً أثقل من مكاسب تدفق قصيرة الأجل.
هذه المقالة تضع كود توصية “For You” الذي أتاحته X للعامة: تعليمات عملية لإدارة حسابات تويتر باستخدام الخوارزمية، وأول مرة ظهرت في موقع Lian News ABMedia.
Related News
من المتوقع أن يتم إدراج SpaceX في 12/6، سعياً لإدراجها ضمن مؤشر ناسداك 100
قدوم Codex إلى تطبيق ChatGPT للهاتف يتيح التحكم عن بُعد في مهام تطوير جهاز Mac
عودة Pi Network عبر PiScan، وترقية KYC المعتمدة على الذكاء الاصطناعي تختصر قائمة الانتظار البشرية بنسبة 50%
سام ألتمان يعلن: تقدم شركة OpenAI Codex للشركات شهرين من الاستخدام «المجاني»
تعتزم "غوغل" التعاون مع "سبيس إكس" ضمن مبادرة "صائد الكويكبات" لبناء حوسبة ذكاء اصطناعي في الفضاء