DeepSeek最新发布的论文透露了一个有意思的技术方向。核心思路是把大语言模型里的长期记忆部分从模型权重中独立出来,转而存储到内存硬件中,这样做能显著释放显存压力。论文中提到的n-gram技术方案就是基于这个思路——通过外部内存存储长期依赖信息,而不是依赖模型内部参数。



从硬件角度看,这种架构转变意味着什么?内存的需求量会大幅上升。随着大模型向这个方向演进,DDR5内存的市场需求可能进入新的增长周期。镁光作为主流内存供应商,长期来看是受益者。

从投资角度考虑,DDR5内存的价格压力可能还会持续走高。如果这类技术方案真的落地推广,今年翻倍的预期并不过分——取决于模型训练和部署的实际进度。
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)