De acordo com a Citrini Research, a 16 de junho, a AMD e a Apple estão a avançar em simultâneo alternativas baseadas em memória flash ao DRAM em produtos de IA. A AMD adquiriu a MEXT para otimizar o desempenho do armazenamento flash a níveis próximos dos do DRAM, reduzindo os custos de memória dos centros de dados; a Apple implementou a tecnologia “LLM in a flash” para alcançar uma otimização semelhante na ponta do dispositivo.
A mais recente investigação da Citrini indica que as necessidades de KV cache na inferência de IA e a HBM que consome 25% da capacidade de produção de DRAM criam uma pressão de custos de memória significativa. O armazenamento flash custa apenas 1/55 do DRAM e, através da otimização do controlador, do empilhamento de NAND e de ajustes no modo de célula, oferece alternativas viáveis de capacidade e largura de banda para a IA na ponta.