يحقق مساعدٌ رياضيٌ مشترك بالذكاء الاصطناعي من Google DeepMind نسبة 47.9% في المستوى 4 من FrontierMath، متفوقًا على GPT-5.5 Pro، ويحل ثلاث مسائل كانت دون حل سابقًا

أطلقت Google DeepMind مساعدًا مشاركًا في الرياضيات قائمًا على الذكاء الاصطناعي، وهو مساعد بحثي متعدد الوكلاء في مجال الرياضيات، حقق دقة 47.9% على معيار FrontierMath (المرتبة 4)، متجاوزًا الرقم القياسي السابق لـ GPT-5.5 Pro البالغ 39.6% في 9 مايو. حلّ النظام 23 من أصل 48 مسألة، بما في ذلك 3 مسائل فشلَت جميع النماذج السابقة في حلّها. بُني النظام على Gemini 3.1 Pro، وتعتمد البنية تصميمًا هرميًا يستخدم وكيلًا منسقًا للمشروع يوزّع المهام على وكلاء فرعيين يتولون استرجاع المراجع والبرمجة والاستدلال، مع عدة وكلاء مراجعين يَتحققون من صحة البراهين قبل تقديمها.

أجرت Epoch AI اختبارات عمياء، ما منع فريق DeepMind من رؤية المسائل، مع السماح لكل سؤال بإجراء حسابات لمدة 48 ساعة. وفي التطبيق الواقعي، استخدم عالم الرياضيات Marc Lackenby النظام لحل تخمين مفتوح من Kourovka Notebook، بما يُظهر قيمته البحثية العملية. يتاح النظام حاليًا لعدد محدود من علماء الرياضيات في مرحلة الاختبار التجريبي.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

قاضٍ أمريكي يحكم بأن تخفيضات منح DOGE غير قانونية بعد استخدام ChatGPT وكلمات متعلقة بالـ DEI، ويمنع تطبيق الإنفاذ يوم الخميس

ذكرت قناة ABC News أنه في يوم الخميس، قضت قاضية اتحادية أمريكية بأن تخفيضات المنح التي نفذها برنامج DOGE المدعوم من إيلون ماسك كانت غير قانونية. وقالت القاضية الأمريكية كولين ماكماهون في نيويورك إن الموظفين استخدموا ChatGPT وبحثًا بالكلمات المفتاحية، بما في ذلك "DEI" و"Equity" و"Inclusion" و"LGBTQ"، للمساعدة في إنهاء برامج التمويل التابعة للمؤسسة الوطنية للعلوم الإنسانية. ومنعت القاضية إدارة ترامب من تطبيق عمليات الإلغاء محل النزاع، مشيرةً إلى أن عملية المراجعة لم تكن تشبه أي نظام عادي لمراجعة ا

GateNewsمنذ 2 د

مسؤول في البنك المركزي الأوروبي يقول إن مخاطر الذكاء الاصطناعي تدفع إلى مراجعة البنية المالية التحتية يوم السبت

قال جوزيه لويس إسكريڤا، عضو مجلس محافظي البنك المركزي الأوروبي ومحافظ بنك إسبانيا، يوم السبت إن على البنوك المركزية مراجعة متانة البنية التحتية المالية وأمنها السيبراني في ظل تزايد استخدام الذكاء الاصطناعي. وأضاف إسكريڤا في فعالية بمدينة تاراغونا: "تفرض التطورات الأخيرة في مجال الذكاء الاصطناعي علينا إعادة تقييم مدى صمود بنيتنا التحتية المالية وأمننا السيبراني". كما شدد على دور البنوك المركزية بوصفها الضامن النهائي للتصدي للمخاطر التي تفرضها العملات المستقرة.

GateNewsمنذ 32 د

سهم Cloudflare يهبط 23.62% في 8 مايو بعد إعلانات أرباح الربع الأول وتخفيض 1,100 وظيفة

انخفض سهم Cloudflare بنسبة 23.62% في 8 مايو إلى 196.13 دولاراً للسهم، عقب صدور تقرير أرباح الشركة للربع الأول وإعلانها عن تسريح نحو 1,100 وظيفة. وبينما تجاوزت إيرادات الربع الأول 640 مليون دولار التوقعات، محققة نمواً سنوياً بنسبة 34%، جاءت إرشادات إيرادات الربع الثاني البالغة 664–665 مليون دولار دون توقعات السوق السابقة البالغة 666 مليون دولار. وتأتي عمليات التسريح، التي تمثل نحو 20% من القوة العاملة، ضمن انتقال الشركة إلى نموذج تشغيل “AI-agent-first”، مع تقدير تكاليف يبلغ 140–150 مليون دولار.

GateNewsمنذ 2 س

تهدف شركة Helsing إلى جمع تمويل بتقييم بقيمة 18 مليار دولار

بحسب صحيفة فايننشال تايمز، تخطط شركة Helsing، وهي شركة ألمانية ناشئة لطائرات مسيّرة تعمل بالذكاء الاصطناعي، لجمع تمويل جديد بتقييم يقارب 18 مليار دولار.

GateNewsمنذ 2 س

نظام مكافآت OpenAI يسجل سلاسل التفكير بالخطأ على 6 نماذج، بما في ذلك GPT-5.4

وفقاً لفريق مواءمة OpenAI، اكتشفت الشركة مؤخراً خطأً تدريبيًا بالغ الأهمية يؤثر في 6 نماذج لغوية كبيرة، بما في ذلك GPT-5.4. Thinking: آلية المكافأة قيّمت عن غير قصد سلاسل التفكير الخاصة بالنموذج — وهي عملية الاستدلال الداخلية قبل توليد الإجابات. لم يتأثر GPT-5.5. ينتهك هذا الحادث مبدأً أساسياً لسلامة الذكاء الاصطناعي، وهو أن سلاسل التفكير يجب ألا تُقيَّم أبداً؛ إذ إن القيام بذلك قد يشجع النماذج على اختلاق reasoning من أجل الحصول على درجات أعلى. ضمّت منظومة التقييم الخاطئة سلاسل التفكير بشكل غير

GateNewsمنذ 4 س

لم تُجرِ شركة علي بابا مفاوضات مع DeepSeek، وتوضّح مصادر في السوق ذلك في 9 مايو

وبحسب مصادر سوقية نقلتها Caixin Daily في 9 مايو، لم تجْرِ شركة Alibaba مفاوضات مع DeepSeek بشأن التمويل. وجاء هذا التوضيح عقب تقارير إعلامية سابقة أشارت إلى أن المحادثات بين الشركتين قد انهارت. وأطلقت DeepSeek جولة تمويل كبيرة في أبريل اجتذبت اهتمامًا من كلٍّ من Tencent وAlibaba.

GateNewsمنذ 4 س
تعليق
0/400
لا توجد تعليقات