حقق "Mercury 2" من Inception Labs نسبة 90% على AIME 2026، متفوقًا على "DiffusionGemma" من Google

في يوم الخميس (18 يونيو)، كشفت شركة Inception Labs عن Mercury 2، متهمةً إياه بأنه أسرع نموذج لغوي استدلالي في العالم، إذ يولّد قرابة 1,000 توكن في الثانية. ووفقاً لإعلان الشركة، سجل Mercury 2 نسبة 90% في AIME 2026 (مسائل امتحان الولايات المتحدة الدولي للرياضيات)، مقارنةً بـ DiffusionGemma من Google التي بلغت 69.1% على المعيار نفسه. كما حقق النموذج نسبة 77% في GPQA، وهو معيار علوم بمستوى الدكتوراه. وأفادت شركة Augment Code، وهي شركة عملاء ترميز بالذكاء الاصطناعي، بأنها سجّلت انخفاضاً بنسبة 82% في زمن الاستجابة وخفضاً للتكلفة بنسبة 90% بعد استبدال Mercury 2 بـ Claude Opus 4.7 من Anthropic، مع الحفاظ على جودة المخرجات.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات