بحسب Beating، قامت Sapient Intelligence بإتاحة برنامج مفتوح المصدر لنظام HRM-Text، وهو نموذج لتوليد النصوص يتضمن مليار معلمة. يعتمد ذلك على بنية نموذج الاستدلال الهرمي (HRM). وباستخدام 40 مليار رمز (token) مُهيكل فقط، يحتاج النموذج إلى 46 ساعة تدريب فحسب على خادميْن مزودين بـ 8 وحدات GPU من نوع H100، مع كلفة حوسبة تبلغ نحو 1,472 دولاراً لإصدار 1B و800 دولار لإصدار 0.6B؛ ويمثل ذلك خفضاً بمقدار 130–600 مرة في حوسبة ما قبل التدريب مقارنةً بالنماذج القياسية.

تأتي مكاسب الكفاءة من تصميم تراجعي ثنائي المقياس الزمني (dual-timescale) مع وحدات Transformer سريعة وبطيئة منفصلة تتناوبان عبر نفس المدخل وتتبَادل المعلومات عبر إضافة الحالة (state addition). كما تم إتاحة إطار هندسي كامل، بما في ذلك استخراج البيانات وتدريب PyTorch الموزع، كمصدر مفتوح. يُرجى ملاحظة أن الأوزان المُفرج عنها غير مُواءمة ومخصصة لما قبل التدريب فقط؛ إذ يدعم النموذج مهام إكمال البادئات، لكنه لا يمكنه العمل كمساعد محادثة.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

05-19 06:46

تقرير SHED لعام 2025 الصادر عن الاحتياطي الفيدرالي: 25% من العمال يستخدمون الذكاء الاصطناعي، وارتفاع استخدام العملات المشفرة إلى 10%

05-19 06:45

SemiAnalysis يختبر وكلاء الذكاء الاصطناعي: 20 ساعة من العمل تكلف 21.33 دولارًا فقط، والعائد على الاستثمار يصل إلى 93.8x

05-19 00:42

ستُنفق Salesforce $300M على رموز Anthropic في 2026 لتطوير برمجة الذكاء الاصطناعي

05-18 21:11

حقق GPT-5 دقة 62.7% في حوادث الإنتاج، لكنه لم يبلغ المستوى المرجعي للخبراء البالغ 72.7%

05-18 02:55

تولّد نماذج الذكاء الاصطناعي في الصين 1.81x نداءات أكثر من الولايات المتحدة؛ ترتفع معاينة Tencent Hy3 بنسبة 210% لتتصدّر

تحليل متعمق