خلال مؤتمر CES، أصبح بنية Rubin الجديدة التي أطلقتها NVIDIA محور النقاشات الأخيرة في السوق، فهي ليست مجرد تطور في بنية MOE، بل تمثل قفزة نوعية أخرى، وتُصمم خصيصًا لعصر الذكاء الاصطناعي Agentic، وغيرها من النقاط التي استعرضتها بعمق، وأشعر حقًا بروح "الثورة الذاتية" التي يقودها الصفراء:



1) في الماضي، كانت NVIDIA تعتمد على ميزة الأجهزة GPU، واستفادت من فترة ازدهار شراء الشركات الكبرى للقدرات الحاسوبية لتدريب النماذج الكبيرة. كانت المنطق بسيطًا، كلما زادت بطاقات الرسوم، استطعت تدريب نماذج أفضل.

لكن الآن، تحولت معركة الذكاء الاصطناعي من "القدرة الحاسوبية" إلى "الاستنتاج"، خاصة مع قدوم عصر Agentic، حيث يحتاج الذكاء الاصطناعي إلى معالجة استنتاجات عالية التردد، متعددة الخطوات، وسياقات طويلة جدًا.

وفي هذا الوقت، تتجاوز معلمات النموذج التريليون، ويكون تدفق البيانات ضخمًا جدًا، حتى لو كانت GPU سريعة جدًا، إذا لم تكن الذاكرة تنقل البيانات بسرعة كافية، فسيضطر GPU إلى التوقف، وهذه هي "جدار الذاكرة"، بمعنى آخر، لم تعد زيادة عدد البطاقات كافية، بل نحتاج إلى ذاكرة عالية السعة وعرض نطاق ترددي عالٍ لدعم ذلك. Rubin يهدف إلى حل هذه المشكلة.

2) لذلك، فإن HBM4 التي أطلقتها Rubin تدعم الجيل الرابع من الذاكرة عالية النطاق الترددي، وتصل إلى عرض نطاق ترددي 22TB/s. والأهم من ذلك، أنها تتوافق مع تقنية NVLink 6 (داخل الخادم، عرض النطاق الترددي 260TB/s)، مما يجعل 72 بطاقة رسومية في المنطق تبدو وكأنها "شريحة عملاقة واحدة".

ماذا يعني هذا؟ سابقًا، كنت تشتري بطاقة رسومية كمكون مستقل، وكان نقل البيانات بين البطاقات يشبه عملية الشحن التي تمر عبر عدة محطات وسيطة. الآن، من خلال تكامل عالي الكثافة، يمكن للبيانات أن تتنقل بين GPU المختلفة تقريبًا دون أن تشعر بالمسافة الفيزيائية، و72 عاملًا لم يعودوا يعملون بشكل مستقل، بل يشاركون عقلًا واحدًا.

وأعتقد أن هذه هي الضربة الحاسمة الحقيقية لـ Rubin: ليست مجرد زيادة في معلمات الأجهزة، بل إعادة هيكلة تدفق البيانات في النظام بأكمله.

3) إذا كانت MOE (نموذج الخبراء المختلط) تمثل ضربة تقليل الأبعاد لنموذج الأعمال الذي يعتمد على "الكتل القوية" من NVIDIA، والتي تعتمد على تراكم البطاقات بشكل عنيف، فإن Rubin يظهر كأنه هجوم استراتيجي من الصفراء، ليس للمنافسة على من يستهلك بطاقات أكثر، بل لإعادة هيكلة تكلفة استخدام الذكاء الاصطناعي بشكل مباشر. وبالطبع، هذا يعني أن NVIDIA تتجه إلى وداع نمط تراكم البطاقات القديم تمامًا.

الصفراء يحسبون حسابات أخرى، فلعصر Agentic أن يحقق انتشارًا حقيقيًا في جميع القطاعات، يجب أن يتجاوز تكلفة الرموز (Tokens)، وهو اتجاه لا يمكن لن NVIDIA أن تصده.

في رأي الصفراء، بدلاً من انتظار استحواذ شركات كجوجل وMeta على السوق عبر تطوير شرائحها الخاصة، أو أن يتم قلب السوق بواسطة نماذج DeepSeek، من الأفضل أن يكونوا هم من يفتحون الطريق.

4) السؤال الآن، كيف ستتصرف NVIDIA بعد ثورتها الذاتية؟ المسار واضح جدًا، من "بيع البطاقات الرسومية" إلى "بيع الأنظمة"، ومن تقديم الخدمة لقلة من الشركات الكبرى إلى جعل الذكاء الاصطناعي في متناول الجميع.

سابقًا، عندما تشتري H100، كانت NVIDIA تربح من مبيعات البطاقة فقط، أما الآن، ستخبرك Rubin: عليك شراء مجموعة كاملة من NVL72، وهي عبارة عن 72 GPU، ومفتاح NVLink، ونظام تبريد سائل كامل، وخزانة، وحتى البرمجيات المصاحبة، كلها مجمعة وتُباع لك.

الصفراء واضحة في حساباتها، فبالرغم من أن تكلفة الأجهزة المجمعة قد تبدو أعلى، إلا أنها تضيف كفاءة استنتاجية قصوى، وتخفض تكلفة الوحدة لاستخدام الذكاء الاصطناعي للمشتري، وبذلك لا تفقد حصتها السوقية.

لكن، لكن، لكن، هذا النهج يرفع أيضًا حاجز الدخول أمام اللاعبين الصغار والمتوسطين. فقط الشركات الكبرى ومزودو الخدمات السحابية يمكنهم تحمله، مما يزيد من احتكار القدرة الحاسوبية. وفي ظل المنافسة الحالية، يمكن اعتباره مقامرة كبيرة، لأنه إذا واجهت HBM4 مشاكل في الإنتاج، فسيتم استبدالها من قبل AMD، وGoogle TPU، وغيرها من البدائل التي ستظهر في النافذة الزمنية، وقد لا يتحقق حلم NVIDIA في بيع الأنظمة بسهولة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت