تطابق واجهة برمجة تطبيقات OpenRouter Fusion API أداء Claude Fable 5 بتكلفة أقل للنصف

DEEPSEEK%2.81-

أطلقت OpenRouter نظام Fusion في 12 يونيو، وهو واجهة برمجة تطبيقات من جهة الخادم توزّع الطلبات (prompts) على عدة نماذج للذكاء الاصطناعي بالتوازي، ثم تستخدم نموذجًا «قاضيًا» ومُركِّبًا (synthesizer) لدمج الردود في إجابة موحّدة. وتدّعي الشركة أن النظام يستطيع مجاراة أداء Claude Fable 5 بتكلفة تبلغ نحو نصف التكلفة، استنادًا إلى اختبارات باستخدام معيار DRACO الخاص بـ Perplexity، حيث سجّل «لوح» نماذج بميزانية محدودة 64.7% مقارنةً بـ Fable 5 عند 65.3%. وقد جاءت عملية الإطلاق بعد وقت قصير من أن علّقت Anthropic الأسبوع الماضي نماذج Fable 5 وMythos 5، عقب توجيه أمريكي للرقابة على التصدير استشهد بنتيجة «اختراق» (jailbreak) محلّ نزاع، حيث وضعت OpenRouter Fusion كبديل، مع وعد بـ «ذكاء بمستوى Fable وبسعر نصف الثمن».

OpenRouter Fusion Processes Prompts Through Multi-Model Panel Architecture

عندما يرسل المستخدم طلبًا (prompt) إلى Fusion، توزّعه OpenRouter على لوحة من النماذج بالتوازي، مع حصول كل نموذج على أدوات بحث ويب وأداة bash. ثم يستخرج نموذج «القاضي» نقاط الإجماع والتناقضات والثغرات العمياء من كل رد. وبعد مرحلة التحليل هذه، يكتب مُركِّب (synthesizer)—Claude Opus 4.8 افتراضيًا—الإجابة النهائية مستندًا إلى ذلك التحليل. تحدث العملية بالكامل على جهة الخادم. ويمكن للمستخدمين تبديل سلسلة النموذج إلى "openrouter/fusion" للحصول على لوحة افتراضية، أو إضافة أداة fusion بحيث تستدعيها نماذجهم الخاصة بشكل انتقائي، أو بناء لوحة مخصّصة داخل غرفة دردشة Fusion دون كتابة أي كود.

Budget AI Panel Scores 64.7% on DRACO Benchmark Against Fable 5's 65.3%

اختبرت OpenRouter Fusion على معيار DRACO، وهو معيار مبنيّ من Perplexity على طلبات أبحاث عميقة حقيقية للمستخدمين. وتصدّر Fable 5 بالتعاون مع GPT-5.5 الخاص بـ OpenAI والمُركَّب بواسطة Opus المخطط عند 69%. وسجّل Fable 5 منفردًا 65.3%، رغم أن سبعًا من مهامه الـ 100 لم تُشغَّل لأن مرشحات المحتوى الخاصة به حجبتها. حققت المجموعة ذات الميزانية المحدودة المكوّنة من Gemini 3 Flash مع النماذج الصينية مفتوحة المصدر Kimi K2.6 وDeepSeek V4 Pro، والمُدمجة والمُركَّبة بواسطة Opus، نسبة 64.7%—متجاوزةً GPT-5.5 منفردًا (60%) وOpus منفردًا (58.8%)، ومحققةً ضمن نقطة مئوية واحدة من أداء Fable بتكلفة تبلغ نحو نصف التكلفة. وبمزاوجة Opus 4.8 مع مثيل منفصل عنه، سجلت 65.5%، أي قفزة بمقدار 6.7 نقاط مقارنةً بـ Opus منفردًا. وتقول OpenRouter إن نحو ثلاثة أرباع هذا التحسن يأتي من خطوة التركيب (synthesis) نفسها، والباقي من تنوع حقيقي في النماذج.

كشفت OpenRouter أن منح اللوحة وصولًا مباشرًا إلى الويب يسمح للنماذج بإظهار مقياس التقييم الخاص بـ DRACO داخل نتائج البحث، وهو خطر «تلوث» تسميه الشركة أمرًا صُدفيًا وليس مقصودًا. وتطلب الإصلاح سطر إعداد واحد لاستبعاد نطاقات استضافة المعيار من أدوات البحث، وتعكس كل الأرقام المنشورة نتيجة تشغيل مُنقّاة.

Anthropic Suspended Fable 5 and Mythos 5 Following U.S. Export Directive

بعد وقت قصير من إصدار Fable 5 وMythos 5 الأسبوع الماضي، أجبر توجيه أمريكي للرقابة على التصدير Anthropic على تعليق تلك النماذج لكل مواطن أجنبي في أنحاء العالم، مستشهدًا بنتيجة «اختراق» محلّ نزاع. وأعلنت OpenRouter عن Fusion على X في 13 يونيو، مقدمةً إياه كبديل مع وعد بـ «ذكاء بمستوى Fable وبسعر نصف الثمن».

OpenRouter Identifies Fusion Limitations for Coding and Long-Horizon Tasks

تقول OpenRouter إن Fusion ليس بديلًا كاملًا لـ Fable. يتخطى DRACO أعمال «بعيدة المدى» (long-horizon)، والتي يُقال إن Fable ما زال يتصدرها. وفي البرمجة، يعمل Fusion كأداة يستدعيها نموذج ترميز بشكل انتقائي، وليس بديلًا شاملاً. وانقسمت سلسلة الإطلاق بين مواقف إيجابية في تتبع المشاعر بنسبة تقارب اثنين إلى واحد. واعتبر الباحث في مجال الذكاء الاصطناعي Andrew Trask أنها «قضية أكبر بكثير مما يبدو»، مجادلًا بأن مختبرات الطليعة لن تمتلك الطليعة وحدها مجددًا. واستشهد المشككون بنتائج برمجة سيئة، وضعف استدعاء الأدوات، وغياب الشفافية لأن Fable 5 لم يعد متاحًا للمقارنة. تعمل Fusion بالكامل على نماذج يتم توجيهها عبر البنية التحتية الخاصة بـ OpenRouter، لذلك فهي لا تعالج مشكلة الرقابة على التصدير من المصدر.

FAQ

ماذا أطلقت OpenRouter في 12 يونيو؟

أطلقت OpenRouter Fusion في 12 يونيو، وهي واجهة برمجة تطبيقات من جهة الخادم توزّع الطلبات (prompts) على عدة نماذج للذكاء الاصطناعي بالتوازي، ثم تستخدم نموذجًا «قاضيًا» ومُركِّبًا لدمج الردود في إجابة موحّدة.

كيف أداء «لوح الميزانية» الخاص بـ Fusion على معيار DRACO مقارنةً بـ Claude Fable 5؟

على معيار DRACO الخاص بـ Perplexity، سجّل «لوح الميزانية» الخاص بـ Fusion، الذي يجمع Gemini 3 Flash وKimi K2.6 وDeepSeek V4 Pro، نسبة 64.7%، محققًا ضمن نقطة مئوية واحدة من نتيجة Fable 5 منفردًا البالغة 65.3% بتكلفة تبلغ نحو نصف التكلفة.

لماذا علّقت Anthropic Claude Fable 5 وMythos 5؟

علّقت Anthropuic Claude Fable 5 وMythos 5 الأسبوع الماضي عقب توجيه أمريكي للرقابة على التصدير استشهد بنتيجة «اختراق» محلّ نزاع، ما يؤثر في إتاحة الوصول لكل مواطن أجنبي في أنحاء العالم.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات