في 6 مارس، أعلنت شركة OpenAI بقيادة سام أوتمن عن إصدار أحدث نماذج الذكاء الاصطناعي GPT-5.4، والذي أصبح متاحًا الآن في ChatGPT وAPI وCodex، مع إصدار أكثر قوة هو GPT-5.4 Pro، المصمم خصيصًا للمؤسسات والأعباء العمل المعقدة.
يدمج GPT-5.4 بشكل عميق بين القدرات المتقدمة في الاستنتاج والبرمجة، ويدعم مهام جداول البيانات والعروض التقديمية والبيانات المنظمة، ويمكنه أيضًا في ChatGPT تخطيط عمليات الاستنتاج مسبقًا، مما يعزز الكفاءة بشكل كبير. يوفر النموذج نافذة سياقية تصل إلى مليون كلمة، وتمت إزالة علامة النسخة التجريبية من API لتحقيق تجربة أكثر استقرارًا للتطبيقات المؤسسية. كما يدعم إصدار Codex توسيع نافذة الكلمات، لكن الطلبات التي تتجاوز 272,000 كلمة ستُحتسب بمعدل ضعف الاستخدام.
أدخل الإصدار الجديد وظيفة استخدام الحاسوب الأصلية، حيث يمكن لوكيل الذكاء الاصطناعي التفاعل مع أنظمة التشغيل والمواقع والتطبيقات عبر لوحة المفاتيح والماوس، مما يتيح أتمتة سير عمل متعدد الخطوات عبر أدوات مختلفة. بالإضافة إلى ذلك، تتيح ميزة “البحث عن الأدوات” للنموذج اختيار الأدوات الخارجية بشكل ديناميكي، دون الحاجة لتحميلها جميعًا في الذاكرة، مما يقلل من استهلاك الكلمات في بيئات معقدة. وتقول OpenAI إن معدل أخطاء الاستجابة في GPT-5.4 انخفض بنسبة 18% مقارنة بـ GPT-5.2، وانخفض احتمال وجود تصريحات كاذبة بمقدار 33%، مما أدى إلى تحسين دقة الاستنتاج وكفاءة استخدام الكلمات بشكل عام.
وفي الاختبارات المعيارية المتخصصة، حقق GPT-5.4 درجة 83% في اختبار GDPval، متفوقًا على العديد من المستويات المهنية في الصناعة؛ وفي اختبار FrontierMath، سجل الإصدار Pro درجة 38% في حل المسائل الرياضية المتقدمة، متفوقًا على نسخة Thinking التي حققت 27.1%. كما أظهرت اختبارات SWE-Bench Pro للبرمجة تفوقًا واضحًا. وأظهرت التقييمات الداخلية أن 68% من المراجعين يفضلون نتائج GPT-5.4، وحصلت على 87.5% في مهمة جداول البيانات لمحاكاة سير عمل مصرفي.
يقدم GPT-5.4 نسختين، Thinking وPro، بأسعار تبلغ 2.5 دولار لكل مليون رمز إدخال و15 دولارًا لكل مليون رمز إخراج، و30 دولارًا لكل مليون رمز إدخال و180 دولارًا لكل مليون رمز إخراج على التوالي، مع استهداف نسخة Pro المستخدمين المؤسساتيين. يمكن للمطورين الوصول إلى GPT-5.4 وGPT-5.3 Pro عبر API، مما يعزز البنية التحتية للذكاء الاصطناعي على منصات المستهلكين والمؤسسات، ويدعم أتمتة المهام الاحترافية والمعالجة الفعالة.