小米披露 MiMo-V2-Pro 训练细节:1T 模型参数,部署数千台 GPU

Gate News 信息,4月24日——小米大型语言模型团队负责人罗富莉在一场深入采访中披露,MiMo-V2-Pro 模型总计拥有 1 万亿参数,训练所需数千台 GPU。她指出,1T 规模代表达到性能接近 Claude Opus 4.6 水平并为下一阶段 AI 代理获取具有竞争力的入场券所需的最低门槛

从技术层面来看,Pro 版本采用极端稀疏注意力机制,全球注意力与滑动窗口注意力的比例为 7:1,用于控制长上下文处理的推理成本。该模型还保留了 MTP (Multi-Token Prediction) 架构,以利用多余的算力实现更快的推理。

在管理层面,100 人规模的 MiMo 团队中,只有 30-40 人直接参与核心迭代。团队运作没有正式的等级体系,也没有明确的子组划分和交付截止时间。遇到诸如训练损失峰值这类不稳定的数值问题时,团队会优先选择停止训练以便调查,即便这意味着操作停摆一到两周,并因此产生数百万美元的算力成本。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

كلود يشخّص الساعة كل 15 دقيقة بعد استعادة الوصول إلى أداة الوقت

ووفقاً لمطوّر Om Patel، بدأ ذكاء Claude AI في التحقق المتكرر من الساعة بعد أن حصل على إمكانية الوصول إلى أداة للوقت في 3 مايو، حيث كان النموذج يتحقق كل 15 دقيقة. وتُبرز هذه الملاحظة أن نماذج اللغات الكبيرة كانت تفتقر سابقاً إلى إدراكٍ زمنيّ فطريّ، ولم تكن على علم بالوقت الحالي أو

GateNewsمنذ 1 س

صندوق Founders Fund يغلق صندوقه الرأسمالي الرائد بقيمة 6 مليارات دولار، وهو الأكبر منذ تأسيسه، في 3 مايو

بحسب بلومبرغ، أكملت شركة Founders Fund جمع التمويل لصندوقها الرئيسي الأحدث بقيمة 6 مليارات دولار في 3 مايو، متجاوزة بشكل كبير صندوقها السابق البالغ نحو 3.4 مليارات دولار. وسيتركز الصندوق، الذي شارك في تأسيسه الملياردير بيتر ثيل، على قطاعات ذات نمو مرتفع تشمل الذكاء

GateNewsمنذ 1 س

آخر استطلاع لصحيفة POLITICO: 45% من الأمريكيين يقولون إن الاستثمار في العملات المشفرة شديد الخطورة، و44% يشعرون بالقلق من أن التقدم في الذكاء الاصطناعي يجري بسرعة مفرطة

وفقاً لاستطلاع POLITICO، رغم أن صناعات الذكاء الاصطناعي والاتصالات المالية المشفرة ضخت تمويلاً سياسياً كبيراً في انتخابات التجديد النصفي الأمريكية لعام 2026، لا يزال الرأي العام الأمريكي متشككاً إلى حد كبير في كلا القطاعين. ووجدت الدراسة أن 45% من الأمريكيين يعتقدون أن الاستثمار في العملات المشفرة ليس بقيمة

GateNewsمنذ 2 س

يدعو مؤسس شركة OpenAI، فلير، إلى طرح الشركة للاكتتاب العام في 2027، بينما يدعم آلتمان إدراجها في الربع الرابع من 2026

تُبدي شيراه فرير، المدير المالي لدى OpenAI، موقفًا حذرًا من جداول الطرح الأولي للاكتتاب العام في 2026، مشيرةً إلى أن عقود الحوسبة السحابية ومراكز البيانات بما يزيد على 1 تريليون دولار تفوق بكثير الإيرادات السنوية الحالية البالغة 25 مليار دولار، وأن المخاطر ستواجه تخفيضًا في تسعيرها في السوق إذا لم يتمكن النمو من تغطية الالتزامات. وتُظهر هذه الخلافات ما بين موقفها وبين ما يدعو إليه الرئيس التنفيذي سام ألتمان علنًا بشأن إدراج 2026 في الربع الرابع؛ إذ تميل فرير إلى تأجيل ذلك إلى 2027 من أجل ترسيخ الانضباط المالي. وقد أصدرت الشركة عدة بيانات تنفي وجود خلافات داخلية.

ChainNewsAbmediaمنذ 4 س

عامل يفوز بقضية تاريخية بشأن استبدال الذكاء الاصطناعي في الصين

صرّح خبراء بأن القرار، الذي يضع سابقة لقضايا مستقبلية لاستبدال وظائف الذكاء الاصطناعي، يقر بأن استبدال الذكاء الاصطناعي لا يمكن التلويح به كتبرير للتخلي عن عقد عمل. تعد الصين ثاني أكبر مركز عالمي للذكاء الاصطناعي. أبرز النقاط: قضت محكمة هانغتشو بأن استبدال تشو...

Coinpediaمنذ 5 س

الهيئة التشريعية في ولاية مينيسوتا تحظر أدوات التزييف العميق للصور العارية التي تعمل بالذكاء الاصطناعي، مع فرض غرامات قد تصل إلى $500K لكل مخالفة

وفقاً لـ Decrypt، في 2 مايو، أقرّت الهيئة التشريعية في ولاية مينيسوتا مشروع قانون يحظر على مواقع الويب وتطبيقاتها تقديم أدوات ذكاء اصطناعي تولّد صوراً عارية وهمية واقعية للأشخاص الذين يمكن تحديدهم. وقد أُحيل الإجراء إلى الحاكم تيم والز للتوقيع، ويمنع المنصات من السماح للمستخدمين بالوصول إلى

GateNewsمنذ 5 س
تعليق
0/400
لا توجد تعليقات