أطلقت Google DeepMind مساعدًا مشاركًا في الرياضيات قائمًا على الذكاء الاصطناعي، وهو مساعد بحثي متعدد الوكلاء في مجال الرياضيات، حقق دقة 47.9% على معيار FrontierMath (المرتبة 4)، متجاوزًا الرقم القياسي السابق لـ GPT-5.5 Pro البالغ 39.6% في 9 مايو. حلّ النظام 23 من أصل 48 مسألة، بما في ذلك 3 مسائل فشلَت جميع النماذج السابقة في حلّها. بُني النظام على Gemini 3.1 Pro، وتعتمد البنية تصميمًا هرميًا يستخدم وكيلًا منسقًا للمشروع يوزّع المهام على وكلاء فرعيين يتولون استرجاع المراجع والبرمجة والاستدلال، مع عدة وكلاء مراجعين يَتحققون من صحة البراهين قبل تقديمها.

أجرت Epoch AI اختبارات عمياء، ما منع فريق DeepMind من رؤية المسائل، مع السماح لكل سؤال بإجراء حسابات لمدة 48 ساعة. وفي التطبيق الواقعي، استخدم عالم الرياضيات Marc Lackenby النظام لحل تخمين مفتوح من Kourovka Notebook، بما يُظهر قيمته البحثية العملية. يتاح النظام حاليًا لعدد محدود من علماء الرياضيات في مرحلة الاختبار التجريبي.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

05-09 09:54

نظام مكافآت OpenAI يسجل سلاسل التفكير بالخطأ على 6 نماذج، بما في ذلك GPT-5.4

05-09 05:53

تعتزم Google فرض استخدام الذكاء الاصطناعي في مقابلات الترميز، مع إطلاق توظيف مدعوم بـ Gemini في وقت لاحق من هذا العام

05-09 05:53

أطلقت شركة China Mobile منصة نماذج ذكاء اصطناعي مع أكثر من 300 تكامل، وخفضت تكاليف الرموز بنسبة 30%

05-08 14:41

شركة SwarmBase تدمج وكيل AIDEN التابع للذكاء الاصطناعي IQ AI في 7 مايو

05-08 06:52

أعلنت GoldFinger و4AI شراكة استراتيجية لدمج الذهب المُرمز (المُرقمن) مع الذكاء الاصطناعي اللامركزي

تحليل متعمق