Gate News 消息,4 月 24 日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上取得满分 120/120,与 Axiom 并列第一。
在使用 LeanExplore 与受约束采样的实践模式中,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著超过 Seed-2.0-Prover (35.50)、Gemini 3 Pro (26.50) 和 Seed-1.5-Prover (26.50)。前沿模式结果显示,V4 领先于 Seed-1.5-Prover (110/120) 和 Aristotle (100/120)。
V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选的自然语言解答,自我验证对结果进行筛选,而形式化智能体在 Lean 中完成严格证明。前沿模式结果使用了大规模计算扩展,而实践模式得分更能反映标准部署能力。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
تطوير وكالات الذكاء الاصطناعي لمكافحة غسل الأموال من شركة FIS وشركة Anthropic، مع بدء الطرح لبنك BMO وبنك Amalgamated Bank في النصف الثاني من عام 2026
تعمل FIS وAnthropic على تطوير وكلاء ذكاء اصطناعي مخصصين لأتمتة التحقيقات في الجرائم المالية، بدءاً بعمليات مكافحة غسل الأموال. وسيقوم وكيل «الجرائم المالية» بجلب البيانات من أنظمة البنوك، وتقييم المعاملات مقابل أنماط معروفة، والمساعدة في دعم المحققين أثناء مراجعة الأدلة المتعلقة ب
GateNewsمنذ 6 د
تطبيق Claude Desktop يحجب نماذج الطرف الثالث بفلتر قائمة سماح في تحديث 6 مايو
بحسب Beating، دفعت Claude Desktop الإصدار 1.6259.1 في 6 مايو، مقدِّمةً التصفية عبر قائمة معرفات النماذج المسموح بها في وضع البوابة (Gateway) الخاص بطرف ثالث. يقيد التحديث الواجهة بحيث تعرض فقط النماذج التي تبدأ معرفاتها بـ "claude" أو "anthropic"، ما يؤدي فعليًا إلى حجب الوصول إلى وضع غير تابع لـ Anthropic
GateNewsمنذ 17 د
توم لي يراهن على بلوغ مؤشر S&P 500 مستوى 7,700 بحلول نهاية العام، ويُبصر فرص صعود في أسهم الذكاء الاصطناعي والشرائح الإلكترونية
خلال مقابلة مع CNBC اليوم (7 مايو)، توقع توم لي أن مؤشر S&P 500 قد يصل إلى 7,700 أو أكثر بحلول نهاية العام. وعلى الرغم من مستويات قياسية في أسهم الولايات المتحدة، قال لي إن الأسهم الرائدة في الذكاء الاصطناعي والرقائق ما زالت مقيمة بشكل معقول، مع نسب السعر إلى الأرباح الآجلة تبلغ نحو 22 t
GateNewsمنذ 33 د
أوبستانج تستكمل استحواذ داوم في 7 مايو، وتخطط لدمج نموذج لغة شمسي
وفقاً لصحيفة The Korea Times، أكملت Upstage استحواذها على AXZ، مشغّل بوابة الإنترنت الكورية الجنوبية Daum، في 7 مايو. وتأتي الصفقة بعد مذكرة في يناير تم بموجبها أن قامت Kakao بتبادل حصتها الكاملة في AXZ مقابل أسهم في Upstage. وتخطط Upstage لاستخدام نموذجها اللغوي الكبير Solar لتطبيقه على
GateNewsمنذ 37 د
سناب تنهي صفقة الذكاء الاصطناعي مع Perplexity وتلغي دفعة بقيمة 400 مليون دولار
استناداً إلى تقرير أرباحه الأخير، أنهت شركة Snap صفقة مع شركة ناشئة في البحث بالذكاء الاصطناعي هي Perplexity، كانت قد أُعلنت في نوفمبر، بما أدى إلى إلغاء دفعة نقدية وأسهم مخططة بقيمة 400 مليون دولار على مدار عام. وقد جرى اختبار هذه الميزة مع مجموعة صغيرة من المستخدمين داخل محادثات Snapchat، لكن الشركتين لم تتفقا على تطبيقها على نطاق أوسع
GateNewsمنذ 47 د
أعلن ماسك في 5/6 حلّ XAI، وإعادة تسميتها لتصبح SpaceXAI، ودمجها ضمن SpaceX
أعلن ماسك في 5/6 على X حل xAI ككيان مستقل، وأن المنتجات المستقبلية للذكاء الاصطناعي ستظهر تحت اسم SpaceXAI، كما استحوذت SpaceX على xAI في فبراير 2026، وهذه هي الخطوة الأخيرة لدمج العلامة التجارية والهيكل التنظيمي بعد الاستحواذ. وفي الفترة نفسها، وقّعت Anthropic وSpaceXAI عقد حوسبة Colossus1، ما يشير إلى أن توحيد العلامة التجارية دخل حيز التنفيذ في اليوم نفسه.
ChainNewsAbmediaمنذ 51 د