وفقاً لبيتينغ، قدّم باحثون من جامعة واترلو وجامعة براون "Planning at Inference"، وهو إطار جديد لتوسيع وقت الاختبار (test-time scaling) في ورقة مُقدمة إلى ICLR 2026. يطبّق الإطار خوارزمية مونت كارلو لشجرة البحث (MCTS) الخاصة بـ AlphaGo لأول مرة على توليد الفيديوهات الطويلة، لمعالجة مشكلات الانحراف الدلالي وتراكم الأخطاء التي تواجهها طرق التوليد التسلسلي التقليدية.

في التجارب باستخدام نموذج Cosmos-Predict2 مفتوح المصدر من Nvidia، أنتج Planning at Inference فيديوهات متماسكة تتجاوز 20 ثانية. وتفوّق النظام على أساليب الأساس مثل Greedy Search وBeam Search من حيث استمرار الأجسام، والاتساق الزمني، ومحاذاة النص-الفيديو. وبالمقارنة مع نماذج رائدة مغلقة المصدر في الصناعة، كانت الفيديوهات التي تولّدها هذه الطريقة أطول بنسبة 18% من Sora وأطول بنسبة 47% من Kling، مع توافر جودة بصرية مماثلة. وكحل تحسين للاستدلال يعمل بوصفه إضافة جاهزة (plug-and-play)، لا يتطلب الإطار إعادة تدريب للنموذج الأساسي.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

منذ 5 س

تتعاون GMatrixs وInsightXHQ لدمج أسواق التنبؤ بالذكاء الاصطناعي ضمن ألعاب الويب3

منذ 7 س

إصدار تقرير M2 التقني من MiniMax؛ نظام Forge يحقق زيادة في سرعة التدريب بمقدار 40 مرة

منذ 11 س

منصة الذكاء الاصطناعي OpenRouter ترفع $113M في جولة التمويل من السلسلة B بقيادة CapitalG التابعة لشركة Google، وتصل إلى تقييم بقيمة 1B+ دولار

منذ 11 س

تتعاون Insilico Medicine مع Human Longevity في بناء نموذج أساس قائم على الذكاء الاصطناعي لعلوم طول العمر

منذ 20 س

أكملت OpenRouter سلسلة $113M من الفئة ب بقيادة CapitalG التابعة لـ Google، وتقوم بمعالجة 25 تريليون رمز أسبوعيًا

تحليل متعمق