مؤسس OpenClaw يشارك تصنيف معدل توافق نماذج الذكاء الاصطناعي، حيث تأتي minimax-m2.1 و kimi-k2.5 الصنع المحلي في المركزين 2 و 3 على التوالي

أخبار Gate، في 8 مارس، أعاد مؤسس OpenClaw (إطار تطوير الوكيل الذكي) بيتر ستاينبرغر مشاركة نتائج اختبار معيارية من طرف ثالث من قبل PinchBench، والتي تقيم أداء نماذج اللغة الكبيرة في مهام وكيل OpenClaw. أظهرت النتائج أن Gemini 3 Flash حققت معدل نجاح 95.1% في مهمة OpenClaw، مما جعله في المركز الأول، تلاه النماذج المحلية minimax-m2.1 و kimi-k2.5 بنسبة 93.6% و 93.4% على التوالي، في المركزين الثاني والثالث. كانت نسبة نجاح Claude Sonnet 4.5 هي 92.7%، و GPT-4o بنسبة 85.2%.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات