وبحسب Citrini Research، في 16 يونيو، تقوم كل من AMD وApple في الوقت نفسه بتطوير بدائل تعتمد على الذاكرة الفلاشية لتحل محل DRAM في منتجات الذكاء الاصطناعي. استحوذت AMD على MEXT لتحسين أداء التخزين الفلاشي القريب من مستويات DRAM، ما يقلل تكاليف الذاكرة في مراكز البيانات؛ كما طورت Apple تقنية "LLM in a flash" لتحقيق تحسين مماثل على حافة الجهاز.
تشير أحدث أبحاث Citrini إلى أن متطلبات KV cache في استدلال الذكاء الاصطناعي، واستهلاك HBM لما نسبته 25% من القدرة الإنتاجية لـ DRAM، يخلقان ضغوطًا كبيرة على تكاليف الذاكرة. تبلغ كلفة التخزين الفلاشي 1/55 فقط من كلفة DRAM، ومن خلال تحسين وحدات التحكم، ودمج طبقات NAND، وضبط نمط الخلايا، يوفر بدائل عملية من حيث السعة والاتساع النطاقي لتطبيقات الذكاء الاصطناعي على الحافة.