2026-01-17 07:27:46

مؤخرًا تم اكتشاف تجربة مثيرة للاهتمام — تم تخصيص 10000 دولار لكل نموذج كبير للمشاركة في سوق التنبؤ بكرة القدم لمدة 6 أسابيع من التداول. وكانت النتائج درامية إلى حد كبير.

تصدر GPT-5.1 المشهد بنسبة ارتفاع 42.6%، تلاه DeepSeek بتحقيق عائد قدره 10.7%، بينما استقر Gemini 3 Pro عند 5.5%. ساهم Opus 4.2 بنسبة 3.9%، وقدم Grok 4.1 Fast أداءً بنسبة 2.1%. ومع ذلك، انخفض GPT-5.2 بنسبة 21.8% — يبدو أن ليست كل النماذج تتقن هذا الأسلوب.

تم تنفيذ هذه المقارنة بواسطة منصة سوق التنبؤ وفريق أبحاث الذكاء الاصطناعي بشكل مشترك، والمنطق وراءها مثير للاهتمام: اختبار أداء نماذج الذكاء الاصطناعي المختلفة في مهام اتخاذ القرارات غير المعيارية باستخدام أموال حقيقية. سوق التنبؤ بكرة القدم يتطلب تحليل البيانات، وتقدير الاحتمالات، وتقييم المخاطر — وهذه بالضبط هي البيئة المثالية لاختبار قدرة النماذج الكبيرة على التداول العملي. الفروق الكبيرة تعكس أن مجرد حجم المعلمات وحجم التدريب لا يكفيان لتمثيل القدرة على اتخاذ القرارات السوقية، فاستراتيجية التنفيذ وجودة فهم البيانات أمران حاسمان أيضًا.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 13

أعجبني
13
8
إعادة النشر
مشاركة

تعليق

0/400

RooftopReserver

· منذ 9 س

GPT-5.2 ذلك العائد السلبي حقًا مذهل، لا يمكن تعلمه حتى من خلال دفع الرسوم... DeepSeek على العكس، هو أكثر استقرارًا، فماذا يعني ذلك؟ النماذج الكبيرة لا تزال تعتمد على الذكاء وليس الحجم أمام السوق

شاهد النسخة الأصليةرد0

BridgeTrustFund

· منذ 18 س

gpt5.1 مباشرة انطلقت بنسبة 42.6٪، هل هذا جدي، gpt5.2 خسرت بشكل مفاجئ بنسبة 21.8٪، هل الفجوة بين الإخوة من نفس المدرسة كبيرة بهذا الشكل

شاهد النسخة الأصليةرد0

DeFiCaffeinator

· منذ 18 س

GPT-5.1 مباشرة انطلقت، DeepSeek تابع بثبات، لكن عملية GPT-5.2 كانت حقًا مذهلة... ما الذي يوضحه فشل النماذج ذات المعلمات الكبيرة، لا بد من الاعتماد على القدرة على اتخاذ القرارات العملية.

شاهد النسخة الأصليةرد0

MetaverseMortgage

· منذ 18 س

GPT-5.2 مباشرة خسر بشكل كبير هاها، هذا هو الاختبار الحقيقي لـ"الذكاء"... الكلام على الورق والواقع العملي أمران مختلفان تمامًا

شاهد النسخة الأصليةرد0

ChainSherlockGirl

· منذ 18 س

GPT-5.2 ذلك الانخفاض بنسبة 21.8% حقًا مذهل، ويُعتبر أكبر لغز لهذا العام... وفقًا لتحليلي، قد يكون هذا الشخص قد قام بفرط التكيف مع نمط معين من المسابقات، مما أدى إلى تلقيه ضربة قاسية من الواقع. بالمقابل، الارتفاع بنسبة 42.6% في 5.1 يثير الشكوك أيضًا، وإذا لم تكن هذه الأرقام مجرد حظ عظيم، فربما يكون قد اكتشف نمطًا لم نراه نحن.

شاهد النسخة الأصليةرد0

0xInsomnia

· منذ 18 س

GPT-5.2 تلك الصفقة كانت حقًا مذهلة، من مائة ألف إلى ثمانية وعشرين ألف... هذه هي الحقيقة وراء تداول العملات الرقمية باستخدام الذكاء الاصطناعي

شاهد النسخة الأصليةرد0

ProveMyZK

· منذ 18 س

GPT-5.2 مباشرة خسر، هذا شيء غريب قليلاً... غريب جدًا --- DeepSeek عاد ليشوش، هذا الشخص فعلاً عنده شيء --- بصراحة، تداول النماذج لا يزال يعتمد على التنفيذ، الكثير من المعلمات لا فائدة منها --- 42.6%؟ GPT-5.1 هل هذا cheat، لا أصدق ذلك تمامًا --- سوق التنبؤ بكرة القدم هنا لاختبار ضغط على الذكاء الاصطناعي، الإبداع فعلاً ممتاز --- هاها، كيف Grok بهذا المستوى الضعيف، أفضل منه Opus --- هذه التجربة تعلمتني قاعدة، حتى النماذج الكبيرة تحتاج إلى استراتيجية --- انتظر، هل بيانات 10 آلاف دولار خلال 6 أسابيع واقعية جدًا، هل هي حقيقية --- DeepSeek لم يتفاخر، على الأقل لم يخسر مالًا --- الجُرأة لاستخدام أموال حقيقية لاختبار الذكاء الاصطناعي، هؤلاء فعلاً لديهم جرأة

شاهد النسخة الأصليةرد0

SatsStacking

· منذ 18 س

gpt5.1 مباشرة انطلاق بنسبة 42%؟ هذه البيانات غير معقولة، يبدو أنها مثالية جدًا، لكن 5.2 خسرت مباشرة 21 تعتبر استحقاقًا ههه

شاهد النسخة الأصليةرد0