أخبار Gate، في 19 مارس، أطلقت شركة Xiaomi رسميًا صباح اليوم سلسلة نماذج الذكاء الاصطناعي MiMo-V2، والتي تشمل النموذج الرائد للاستنتاج Pro، والمنصة متعددة الوسائط Omni، ونموذج تحويل النص إلى كلام TTS.
يحتوي MiMo-V2-Pro على أكثر من تريليون من المعلمات الإجمالية (42 مليار معلمة نشطة)، ويدعم سياقًا طويلًا يتجاوز مليون رمز، مصمم خصيصًا لسيناريوهات عمل الوكيل. يحتل المرتبة الثامنة عالميًا، والثانية محليًا، في تصنيف Artificial Analysis، ويحتل المركز الثالث عالميًا في تقييمات PinchBench وClawEval. أداءه يتفوق على Claude Sonnet 4.6 ويقترب من Opus 4.6، لكن سعره فقط خمس سعر الأخير: إدخال ضمن سياق 256K يكلف دولار واحد، والإخراج يكلف 3 دولارات لكل مليون رمز، وإدخال ضمن سياق 1M يكلف دولارين، والإخراج 6 دولارات لكل مليون رمز. تم دمج وحدة MiMo Claw بالفعل مع نظام WebOffice الخاص بكاسون، وWPS Lingxi متصل بشكل متزامن.
MiMo-V2-Omni هو منصة متعددة الوسائط تدعم إدخال النصوص والصور والصوت والفيديو بأربعة مسارات، مع سياق يصل إلى 256K، وسعر الإدخال 0.4 دولار، والإخراج 2 دولار لكل مليون رمز. فيما يخص الصوت، يدعم فهم الصوت المستمر لأكثر من 10 ساعات، ويتفوق في التقييمات على Gemini 3 Pro؛ وفهم الصور يتجاوز Claude Opus 4.6 ويقترب من Gemini 3 Pro.
أما MiMo-V2-TTS، فهو يعتمد على أداة تحويل الصوت التي طورتها الشركة ذاتيًا، ويُدرب على أكثر من مليار ساعة من بيانات الصوت، ويدعم التحكم متعدد المستويات من النمط العام إلى العاطفة الجزئية، ويمكنه توليف أصوات غنائية عالية الجودة، مع تغطية للهجات مثل الشمال الشرقي، سيتشوان، خنان، كانتون، وتايوان.
تم الآن ربط النماذج الثلاثة بمنصات Xiaomi miclaw، وMiMo Studio، وKingsoft Office، ومتصفح Xiaomi، ويمكن استدعاؤها عبر أطر تطوير الوكيل الخمسة OpenClaw وOpenCode وKiloCode وBlackbox وCline، لمدة أسبوع مجانًا بشكل محدود.