Meituan LongCat-2.0 مفتوح المصدر: 1.6 تريليون معلمة بدون GPU من NVIDIA

بحسب تقرير لوكالة رويترز بتاريخ 30 يونيو، أصدرت شركة ميتوان (Meituan) نموذج الذكاء الاصطناعي مفتوح المصدر LongCat-2.0، بحجم معاملات يبلغ 1.6 تريليون، ويعتمد بنية الخبراء المختلطين المتناثرين (Sparse MoE)، ودُرب بالكامل باستخدام رقائق مجموعة فائقة (ASIC) محلية، دون استخدام أي وحدات معالجة رسومية (GPU) من Nvidia أو حزمة برمجيات CUDA، ويبلغ حجم نافذة السياق للنموذج مليون رمز (token).

المواصفات الفنية لـ LongCat-2.0 وسيناريوهات التطبيق المستهدفة

يعتمد LongCat-2.0 بنية الخبراء المختلطين المتناثرين (Sparse MoE)، المشابهة لخطط DeepSeek وMixtral التابعة لـ Mistral: لا ينشط النموذج كامل المعاملات البالغة 1.6 تريليون في وقت واحد، بل يختار موجه داخلي لكل رمز مجموعة من النماذج الفرعية المتخصصة، مما يقلل تكلفة الاستدلال مقارنة بنموذج كثيف بنفس الحجم. المواصفات الفنية الرئيسية وقيود النشر كالتالي:

حجم المعاملات: 1.6 تريليون (بنية MoE متناثرة، لا تنشط كل المعاملات في وقت واحد)

نافذة السياق: مليون رمز (بينما DeepSeek-R1-0528 وGPT-OSS كلاهما 128 ألف رمز)

عتاد التدريب: مجموعة فائقة من رقائق ASIC محلية (بدون وحدات GPU من Nvidia، وبدون حزمة CUDA)

التطبيقات المستهدفة: وكلاء الذكاء الاصطناعي، أدوات البرمجة (فهم الكود، تحرير المكتبات بالكامل، المهام المؤتمتة)

شكل النشر: مجموعة استدلال على مستوى مراكز البيانات، لا تدعم الأجهزة الاستهلاكية أو معظم النشر المحلي

خلفية السوق لتدريب الرقائق المحلية وبيانات بيرنشتاين

تدّعي ميتوان أن بنية الاستدلال الأساسية لـ LongCat-2.0 قابلة للنقل، ويمكن تشغيلها على الأجهزة الصينية الحالية. يأتي هذا الإصدار في وقت تستمر فيه ضوابط التصدير الأمريكية في تقييد تصدير رقائق الذكاء الاصطناعي المتقدمة إلى الشركات الصينية.

تقدر شركة الأبحاث الاستثمارية بيرنشتاين (Bernstein) أن حصة Nvidia الحالية في سوق رقائق الذكاء الاصطناعي في الصين تبلغ حوالي 40%، مع حصة مماثلة لشركة Huawei؛ وتتوقع بيرنشتاين أيضاً أن تحقق Huawei تقدماً هذا العام، مما يؤدي إلى انخفاض حصة Nvidia في السوق الصينية بنحو 8 نقاط مئوية.

الوضع الحالي لادعاءات الأداء: لا تحقق من طرف ثالث بعد

قارنت ميتوان في اختباراتها المعيارية المنشورة LongCat-2.0 مع عدة نماذج مغلقة المصدر، لكن التقارير ذات الصلة تشير إلى أن ادعاءات الأداء هذه لم تُتحقق بعد من خلال تقييم مستقل ومحايد من طرف ثالث.

يشير التقرير أيضاً إلى أن التحسين للرقائق المحلية قد يحد من أداء LongCat-2.0 على أجهزة Nvidia، التي لا تزال تهيمن على مراكز البيانات عالمياً. تقول ميتوان إن بنية الاستدلال الأساسية لا تزال قابلة للنقل، وستحدد الاختبارات المستقلة مدى رغبة المطورين خارج الصين في اعتمادها.

الأسئلة الشائعة

ما أهمية نافذة السياق البالغة مليون رمز في LongCat-2.0؟

حتى وقت التقرير، كانت نافذة السياق لـ DeepSeek-R1-0528 وOpenAI GPT-OSS تبلغ 128 ألف رمز كحد أقصى؛ وتدّعي LongCat-2.0 الوصول إلى مليون رمز، مما قد يكون ذا أهمية للتطبيقات التي تتطلب معالجة مكتبات برمجية طويلة جدًا أو سلاسل مهام معقدة. لكن هذه الادعاءات لا تزال تنتظر التحقق المستقل.

ما هي خلفية ميتوان في أبحاث الذكاء الاصطناعي؟

الأعمال الأساسية لميتوان هي توصيل الطعام والخدمات المحلية. دخلت مجال الذكاء الاصطناعي بعد استحواذها عام 2023 على شركة الناشئة للذكاء الاصطناعي "لايت يير بيوند" (Light Year Beyond) مقابل 281 مليون دولار، وأعلنت علنًا عن خططها للنماذج الداخلية فقط في عام 2025، ويُعتبر LongCat-2.0 محرك الاستدلال لوكلاء الذكاء الاصطناعي وأدوات البرمجة لدى الشركة.

ما هي مزايا وعيوب بنية MoE المتناثرة لـ LongCat-2.0 مقارنة بنموذج كثيف بحجم 1.6 تريليون؟

الميزة الأساسية لـ MoE المتناثرة هي عدم تنشيط كل المعاملات، بل التوجيه إلى نماذج فرعية محددة، مما يقلل تكاليف الاستدلال الحسابي مقارنة بنموذج كثيف بنفس الحجم. لكن البنية المُحسّنة لعتاد معين (مثل رقائق ASIC المحلية) قد تواجه قيودًا في الأداء على عتاد آخر (مثل وحدات GPU من Nvidia)، ولم تُنشر نتائج الاختبارات المستقلة بعد.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات