GPT-5.5 تعود إلى الصدارة في البرمجة، لكن OpenAI تغيّر المعايير بعد الخسارة أمام Opus 4.7

رسالة أخبار البوابة، 27 أبريل — أصدرت شركة SemiAnalysis، وهي شركة متخصصة في تحليل أشباه الموصلات والذكاء الاصطناعي، معيارًا/مقارنة مرجعية (benchmark) لتقييم المساعدين البرمجيين، بما في ذلك GPT-5.5 و Claude Opus 4.7 و DeepSeek V4. وكانت النتيجة الرئيسية: تُعدّ GPT-5.5 أول عودة من OpenAI إلى صدارة التقدم في نماذج البرمجة خلال ستة أشهر، حيث بات مهندسو SemiAnalysis يتناوبون الآن بين Codex وClaude Code بعد أن كانوا يعتمدون تقريبًا حصريًا على Claude. تستند GPT-5.5 إلى نهج تدريب مسبق جديد مُشفّر باسم “Spud” وتمثل أول توسع في حجم التدريب المسبق من OpenAI منذ GPT-4.5.

في الاختبارات العملية، ظهرت قسمة واضحة للأدوار. يتولى Claude تخطيط المشروعات الجديدة والإعداد الأولي، بينما يتفوق Codex في إصلاحات الأعطال التي تتطلب التفكير المكثف. يُظهر Codex فهمًا أقوى لهياكل البيانات والاستدلال المنطقي، لكنه يواجه صعوبة في استنتاج نية المستخدم الغامضة. في مهمة ضمن لوحة تحكم واحدة، أعاد Claude تلقائيًا تخطيط صفحة المرجع لكنه اخترع كميات كبيرة من البيانات، بينما تخطى Codex التخطيط لكنه قدّم بيانات أدق بكثير.

تكشف التحليلات عن تفاصيل تلاعب بالمعيار/المقارنة المرجعية: حثّت مشاركة مدونة OpenAI في فبراير الصناعة على اعتماد SWE-bench Pro بوصفه المعيار/المرجع الجديد لمقاييس البرمجة. ومع ذلك، غيّرت إعلانات GPT-5.5 إلى معيار/مرجع جديد يُسمى “Expert-SWE.” والسبب، المدفون في تفاصيل دقيقة، هو أن GPT-5.5 تفوقت عليها Opus 4.7 على SWE-bench Pro وتراجعت بشكل كبير عن Mythos (77.8%) غير المُعلن من Anthropic.

وبخصوص Opus 4.7، نشرت Anthropic تحليلًا بعد الوفاة (postmortem) بعد أسبوع واحد من الإصدار، واعترفت بوجود ثلاث حالات خلل (bugs) في Claude Code استمرت لعدة أسابيع من مارس إلى أبريل، مما أثّر على ما يقرب من جميع المستخدمين. وكان قد أبلغ عدة مهندسين سابقًا عن تدهور في الأداء في الإصدار 4.6، لكن تم تجاهل ذلك باعتباره ملاحظات ذاتية. بالإضافة إلى ذلك، فإن المُرمّز (tokenizer) الجديد في Opus 4.7 يزيد استخدام الـ tokens بنسبة تصل إلى 35%، وهو ما اعترفت به Anthropic بشكل صريح—وهو ما يشكّل فعليًا زيادةً خفية في السعر.

تم تقييم DeepSeek V4 على أنه “يواكب وتيرة الخط الأمامي لكنه لا يتصدر,” مع وضع نفسه كبديل الأقل تكلفة بين نماذج المصدر المغلق. وأشارت التحليلات أيضًا إلى أن “Claude لا يزال يتفوق على DeepSeek V4 Pro في مهام الكتابة الصينية عالية الصعوبة،” مع تعليق بأن “Claude فاز على النموذج الصيني بلغته الخاصة.”

يقدم المقال مفهومًا رئيسيًا: ينبغي تقييم تسعير النماذج من خلال “تكلفة المهمة” بدلًا من “تكلفة الـ token.” إن تسعير GPT-5.5 ضعف تسعير GPT-5.4 (input $5, output $30 per million tokens)، لكنه ينجز المهام نفسها باستخدام tokens أقل، مما يعني أن التكلفة الفعلية ليست بالضرورة أعلى. تُظهر بيانات SemiAnalysis الأولية أن نسبة إدخال Codex إلى إخراجه هي 80:1، وهي أقل من نسبة Claude Code البالغة 100:1.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

سييرا تجمع 950 مليون دولار، وتقييمها 15.8 مليار: بريت تايلور يقتحم صدارة خدمات العملاء بالذكاء الاصطناعي بصفته رئيسًا لـ OpenAI

تأسست Sierra على يد Bret Taylor بالشراكة، وأعلنت اكتمال جولة التمويل Series E بقيمة 950 مليون دولار، بتقييم يبلغ 15.8 مليار دولار، استثمر فيها Tiger Global و GV. وصلت إلى 150 مليون دولار من ARR خلال 8 فصول، مع معدل اختراق Fortune 50 بما يتجاوز 40%. تتموضع كس منصة خدمات عملاء عمودية للشركات تتمحور حول وكلاء الذكاء الاصطناعي، وتوفر تدفقات عمل جاهزة للاستخدام. كما يشغل Taylor منصب رئيس مجلس إدارة OpenAI، وتُعد الحوكمة والإفصاحات المتعلقة بالمصالح محور التركيز.

ChainNewsAbmediaمنذ 22 د

أعادت OpenAI هيكلة WebRTC لمكدس الصوت: 900 مليون مستخدم نشط أسبوعياً، والـ Relay المكتوب بلغة Go هو المحور الأساسي

أعلنت OpenAI عن بنية relay رقيقة مكتوبة بلغة Go، إلى جانب بنية transceiver مركزية، لإعادة هيكلة طبقة الوسائط في WebRTC بما يدعم خدمات الصوت لمليار مستخدم نشط أسبوعياً قدره 900 مليون. يتم تركيز الاتصالات الكثيفة من حيث الحالة على transceiver، بينما يعمل relay كطبقة بيانات عديمة الحالة، ما يعالج اختناقات مثل جلسة واحدة لكل منفذ، وتنازع ملكية ICE/DTLS، وزيادة زمن قفزة أولى منخفضة التأخير، بما يسهّل التوسع الأفقي. وستكون المراقبة لاحقاً لما إذا كان المشروع مفتوح المصدر، وحجم Realtime API والتسعير، بالإضافة إلى متابعة المنافسين.

ChainNewsAbmediaمنذ 24 د

واجهة Gemini API تدعم Webhooks: تساعد Google في معالجة مشكلة الاستقصاء المتكرر للمهام الطويلة، ويمكن لـ Batch وVeo تقديم عمليات الدفع فوراً

أطلقت Google Gemini API في 4 مايو Webhooks، حيث يتم دفع النتائج تلقائيًا إلى عنوان callback URL عند اكتمال المهام الطويلة، ما يستبدل أسلوب الاستقصاء الدوري (polling)، ويقلّل استهلاك الموارد والتأخير، ويبسّط عملية البرمجة. وهو مناسب لـ Batch API وVeo2 واستدلالات السياقات الطويلة، ولا سيما ملائم للحوسبة عديمة الخوادم (serverless). وبالمقارنة مع OpenAI التي تميل إلى استخدام SSE، ومع Anthropic التي ما زالت تعتمد الاستقصاء الدوري، تبرز Google اهتمامها ببنية تحتية للمطوّرين. وتستهدف المرحلة المقبلة تعزيز آليات الأمان وتوسيع النماذج. وبالنسبة للمطوّرين في تايوان، فإن الدمج الفوري يمكن أن يخفّض بوضوح الحصة (quota) والعبء على النظام.

ChainNewsAbmediaمنذ 26 د

كروتريم تتحول إلى خدمات سحابية للذكاء الاصطناعي في 5 مايو، وتنشر أول أرباح مع وصول إيرادات السنة المالية 26 إلى 31.6 مليون دولار

وبحسب وكالة برس ترست أوف الهند، أعادت شركة الذكاء الاصطناعي الهندية Krutrim تموضعها بوصفها مزود خدمات سحابية للذكاء الاصطناعي داخل البلاد في 5 مايو، مع إيقاف جهود تصميم الرقائق وتوجيه رأس المال والموهبة إلى البنية التحتية السحابية. وأفادت الشركة بأن إيرادات السنة المالية 2026 بلغت نحو 3 مليارات روبية (31.6 مليون دولار أمريكي

GateNewsمنذ 1 س

اختتمت Haun Ventures صندوقًا بقيمة 1 مليار دولار في 5 مايو، مستهدفة شركات ناشئة في مجال التشفير والذكاء الاصطناعي

ووفقاً لصحيفة Cointelegraph، أكملت Haun Ventures جمع 1 مليار دولار لصندوق جديد في 5 مايو، على أن يتم تخصيص رأس المال بالتساوي بين الاستثمارات المبكرة والمتأخرة. سيركز الصندوق على الشركات الناشئة في مجالات العملات المشفرة والذكاء الاصطناعي والتقنيات البديلة

GateNewsمنذ 2 س

تجاوزت استثمارات أنثروبيك وأوبن إيه آي 1.1 مليار دولار في تداول العملات المشفرة بالتجزئة منذ بدء 2026

وفقاً لبلومبرغ، ضخ مستثمرون تجزئة ما يقارب 1.13 مليار دولار في التداول بالرافعة المالية على المشتقات الخاصة بشركات الذكاء الاصطناعي منذ بداية عام 2026. تتيح منصتا العملات المشفرة Ventuals وPreStocks التداول على مدار 24 ساعة على شركات تشمل Anthropic وOpenAI وSpaceX دون منح وصول مباشر

GateNewsمنذ 2 س
تعليق
0/400
لا توجد تعليقات