عاجل: قدمت جوجل تقنية TurboQuant، وهي تقنية لضغط الذاكرة قصيرة المدى لنماذج الذكاء الاصطناعي وتسريع بعض عملياتها الحسابية.


بينما كانت العناوين تتحدث عن قفزات مذهلة، تشير التجارب المستقلة الأولية إلى تحسينات أكثر تواضعًا، لكنها لا تزال ذات صلة لأولئك الذين يعملون مع سياقات طويلة، ومستندات موسعة، وقواعد بيانات كبيرة.
يهدف TurboQuant إلى تقليل استهلاك الذاكرة لذاكرة التخزين المؤقت للقيم المفتاحية (KV) في نماذج الذكاء الاصطناعي وتسريع معالجة الطلبات.
شاهد النسخة الأصلية
post-image
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.21Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.27Kعدد الحائزين:2
    0.24%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.15%
  • تثبيت