El analista Zeitgeist afirmó que la demanda de chips de memoria utilizados en inteligencia artificial supera por órdenes de magnitud la capacidad actual de producción global, lo que sugiere que las acciones de los fabricantes de memoria podrían aumentar hasta diez veces si se valoraran según las necesidades reales de cómputo en lugar de máximos históricos. Zeitgeist aportó un ejemplo de inversión: $50.000 invertidos en acciones de Micron en septiembre del año pasado tendrían un valor aproximado de $489.000 hoy. El analista atribuyó el desajuste oferta-demanda a límites fijos de memoria de alto ancho de banda (HBM) en los aceleradores de IA y a la adopción acelerada de agentes de IA que consumen mucha más memoria por sesión que los chatbots tradicionales, un cambio que ocurre mientras la producción de memoria escala más lento que el crecimiento del uso.
Los aceleradores de IA enfrentan límites fijos de memoria
Cada acelerador de IA se entrega con una cantidad fija de memoria de alta velocidad que no puede ampliarse después del despliegue. Según Zeitgeist, un chip H100 estándar lleva 80 GB de HBM; las generaciones más nuevas ofrecen hasta 192 GB, y el futuro B300 tendrá 288 GB. Ese tope determina cuántas solicitudes puede procesar simultáneamente un solo acelerador.
El analista explicó que la carga principal de memoria no proviene de los pesos del modelo, sino de la caché KV: memoria de sesión que crece con cada token generado. Zeitgeist calculó que una sesión con un contexto de 128.000 tokens requiere aproximadamente 20 GB de memoria, lo que significa que solo cuatro sesiones de ese tipo agotarían por completo los recursos de un solo H100. Modelos avanzados como Claude Opus 4.8 o GPT-5.5 requieren entre 40 GB y 100 GB para una sola solicitud larga, según el analista.
El analista calcula un déficit de memoria de 60x por la adopción de agentes
Zeitgeist identificó el cambio de chatbots simples a agentes de IA como el impulsor clave de la demanda de memoria. Mientras que una pregunta normal implica una carga mínima para la memoria, un agente que llama herramientas de forma independiente y acumula contexto puede alcanzar fácilmente 100.000 tokens o más. El analista calculó que un solo trabajador del conocimiento que ejecute diez agentes de ese tipo en paralelo requeriría aproximadamente 152 GB de memoria.
Zeitgeist señaló que hay aproximadamente 250 millones de trabajadores del conocimiento en todo el mundo. El analista estimó que, con 100 sesiones agentic por persona por día, el mundo necesitaría alrededor de 60 veces más memoria que la que se producirá en 2026. Zeitgeist reconoció que nuevos métodos de atención pueden reducir el uso de memoria entre 4 y 8 veces, pero afirmó que la demanda está creciendo más rápido, ya que los agentes reemplazan los chats simples, las ventanas de contexto pasan de 128.000 a 10 millones de tokens, y el uso de IA por cada trabajador pasa de cero a cientos de sesiones.
SK Hynix supera a Samsung a medida que se dispara la demanda de memoria de IA
El fabricante de memoria surcoreano SK Hynix superó a Samsung como la empresa cotizada más valiosa del país, impulsado por su posición en chips de memoria de alto ancho de banda usados para cargas de trabajo de inteligencia artificial. Zeitgeist indicó que este cambio respalda la tesis de que los productores de memoria se están convirtiendo en grandes beneficiarios de la carrera por la infraestructura de IA: las empresas capaces de producir chips de memoria avanzados estarían posicionadas para ver aumentos bruscos en ingresos y valoraciones a medida que la demanda de HBM crece más rápido que la oferta.
Preguntas frecuentes
¿Qué dijo el analista Zeitgeist sobre la valoración de las acciones de chips de memoria?
Zeitgeist afirmó que las acciones de los fabricantes de memoria podrían subir hasta diez veces desde los niveles actuales si se valoraran por las necesidades reales de cómputo en lugar de máximos históricos, citando que la demanda de memoria para IA supera la capacidad global de producción por órdenes de magnitud.
¿Cuánta memoria requiere una sesión de agente de IA según Zeitgeist?
Zeitgeist calculó que una sesión con un contexto de 128.000 tokens requiere aproximadamente 20 GB de memoria, mientras que modelos avanzados como Claude Opus 4.8 o GPT-5.5 requieren entre 40 GB y 100 GB para una sola solicitud larga. El analista estimó que un trabajador del conocimiento que ejecute diez sesiones de agente en paralelo necesitaría aproximadamente 152 GB de memoria.