جوجل تطلق Gemini 3.1 Pro: قدرة الاستنتاج تتضاعف خلال ثلاثة أشهر، سعر API ثابت، ميزة شرائح TPU الخاصة

動區BlockTempo

جوجل تطلق Gemini 3.1 Pro، حيث تضاعف نتائج ARC-AGI-2 في الاختبارات بنسبة تصل إلى 77.1%، وتحقق المركز الأول في 13 من أصل 16 معيارًا، مع بقاء أسعار API دون تغيير، مما يسرع سباق التسلح في الذكاء الاصطناعي ويقلص دورة حياة كل جيل من النماذج.
(ملخص سابق: أطلقت Gemini وظيفة “امتحان SAT المحاكي” مجانًا، ويقدم المعلم الذكي إرشادات تعلم شخصية)
(معلومات إضافية: جوجل تطلق رسميًا “Gemini 3”! تتصدر النموذج الأذكى عالميًا، ما هي أبرز مميزاته؟)

فهرس المقال

  • “الاستدلال القابل للتعديل”: تمكين المطورين من تحديد مدى ذكاء النموذج
  • الأسعار ثابتة، والأداء يتضاعف: من يدعم هذه الحرب؟
  • لا فائز يهيمن على الجميع، لكن هناك نمط تنافسي واضح

أطلقت جوجل رسميًا في الليلة الماضية إصدار معاينة من Gemini 3.1 Pro، حيث حقق النموذج على معيار ARC-AGI-2 (الذي يقيس القدرة على حل مشكلات منطقية جديدة) نسبة 77.1%، متفوقًا بأكثر من ضعف على الإصدار السابق Gemini 3 Pro.

وفي الصورة أدناه، من بين 16 معيارًا تقييمًا، فاز 3.1 Pro بـ13 منها بالمركز الأول.

أما النتائج الأخرى فهي أيضًا مثيرة للاهتمام: GPQA Diamond (معرفة علمية متخصصة) 94.3%، SWE-Bench Verified (تصحيح الكود الذاتي) 80.6%، Humanity’s Last Exam 44.4%، MMMLU 92.6%.

وفي معيار MCP Atlas (الذي يقيس سير عمل استخدام أدوات متعددة الخطوات)، حقق 3.1 Pro نسبة 69.2%، متفوقًا على Claude و GPT-5.2 بنحو 10 نقاط مئوية.

“الاستدلال القابل للتعديل”: تمكين المطورين من تحديد مدى ذكاء النموذج

الميزة الجديدة ذات الأهمية الاستراتيجية في Gemini 3.1 Pro هي نظام مستويات التفكير الثلاثة (thinking level). يمكن للمطورين التبديل بين “ميزانية الاستدلال” منخفضة، متوسطة، عالية، بحيث يستخدم النموذج مستوى منخفض لتوفير التأخير والتكلفة عند الطلبات البسيطة، ويزيد إلى مستوى عالي عند الحاجة إلى تصحيح أخطاء معقدة.

عند ضبطه على high، يصبح سلوك 3.1 Pro قريبًا من نموذج الاستدلال المخصص من جوجل Gemini Deep Think، والذي وصفته شركة VentureBeat بأنه “نسخة مصغرة من Deep Think التي تُشغل حسب الحاجة”.

وفي معيار BrowseComp (الذي يقيس قدرة الوكيل الذكي على البحث عبر الإنترنت بشكل مستقل)، ارتفعت النسبة من 59.2% إلى 85.9%. إن وجود وكيل ذكي قادر على البحث عبر الإنترنت، وإنجاز مهام متعددة الخطوات، مع دقة استنتاج عالية، هو الاتجاه الذي يراهن عليه قطاع الذكاء الاصطناعي.

الأسعار ثابتة، والأداء يتضاعف: من يدعم هذه الحرب؟

أسعار API ثابتة عند 2 دولار لكل مليون رمز إدخال، و12 دولار لكل مليون رمز إخراج، وهو نفس سعر Gemini 3 Pro. وبالتحويل، فإن تكلفة إدخال Gemini 3.1 Pro أقل بنسبة 60% من Claude Opus 4.6، وتكلفة الإخراج أقل بنسبة 52%.

مع أداء يتضاعف دون تغيير في السعر، تستخدم جوجل استراتيجية “الضغط على القيمة مقابل السعر” للاستحواذ على سوق المطورين.

ويظل حجم النافذة النصية 1 مليون رمز (أي خمسة أضعاف Claude، و2.5 ضعف GPT-5)، مع توسيع الحد الأقصى للإخراج إلى 65,000 رمز، وزيادة الحد الأقصى لتحميل الطلبات من 20MB إلى 100MB، وحتى دعم إدخال روابط يوتيوب مباشرة ليقوم النموذج “بمشاهدة” الفيديو.

وراء استراتيجية عدم رفع الأسعار، تكمن ميزة جوجل التنافسية في تطوير شرائح TPU والبنية التحتية السحابية، حيث تؤكد أن امتلاك شرائح خاصة هو أكبر حاجز دفاعي في سباق التسلح في الذكاء الاصطناعي.

لا فائز يهيمن على الجميع، لكن هناك نمط تنافسي واضح

بالطبع، ليس Gemini 3.1 Pro هو الفائز في جميع المجالات.

فمثلاً، Claude Sonnet 4.6 (وضع Thinking Max) يتعادل مع 3.1 Pro في الذاكرة طويلة المدى (MRCR v2)، لكنه يتفوق بشكل كبير في مهمة الخبرة GDPval-AA Elo (1633 مقابل 1317).

وفي مهمة البرمجة عبر الطرفية (Terminal-Bench 2.0)، يتفوق GPT-5.3-Codex بنسبة 77.3% على 3.1 Pro الذي حقق 68.5%. كما أن معدل الهلوسة في سلسلة Claude (حوالي 3%) أقل بشكل ملحوظ من Gemini وGPT (متوسط حوالي 6%).

وتتوقع خريطة سباق الذكاء الاصطناعي لعام 2026 أن تتصدر جوجل في الاستدلال والمهام الوكيلة، وأن تتفوق شركة Anthropic في الدقة والأمان، وأن تحافظ شركة OpenAI على ريادتها في توليد الكود والنظام البيئي. لا يوجد فائز يسيطر على السوق بالكامل، لكن من المحتمل أن يتغير المشهد كل ثلاثة أشهر.

سباق التسلح في نماذج الذكاء الاصطناعي لن يتوقف. السؤال الوحيد هو: لمن ستؤول أرباح هذا السباق في النهاية: للمطورين، للمنصات، أم لمن يدفع أكبر الفواتير؟

وجوجل اليوم تقول: دع المطورين يستخدمونه بأسعار معقولة أولاً، ثم نناقش باقي الأمور. هذه الاستراتيجية نجحت من قبل في عصر الحوسبة السحابية، وإذا كانت ستنجح مرة أخرى، فالأمر يعتمد على ما إذا كان الذكاء الاصطناعي يمكن أن يخلق قيمة حقيقية للشركات تبرر عودتها على الاستثمار، وليس فقط تحقيق أرقام قياسية أعلى.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات