Analyst Zeitgeist erklärte, dass die Nachfrage nach Speicherchips, die in künstlicher Intelligenz eingesetzt werden, die aktuelle globale Produktionskapazität um ein Vielfaches übersteigt. Das deute darauf hin, dass die Bestände von Speicherherstellern um das Zehnfache steigen könnten, wenn sie nach dem tatsächlichen Rechenbedarf bewertet würden – nicht nach früheren Hochständen. Zeitgeist nannte ein Anlagebeispiel: 50.000 US-Dollar in Micron-Aktien angelegt im September des vergangenen Jahres wären heute ungefähr 489.000 US-Dollar wert. Der Analyst führte die Angebots-Nachfrage-Ungleichgewichte auf feste Limits für High-Bandwidth Memory (HBM) in KI-Accelerators zurück sowie auf die schnelle Verbreitung von KI-Agenten, die pro Sitzung deutlich mehr Speicher verbrauchen als traditionelle Chatbots. Diese Entwicklung vollzieht sich, während die Speicherproduktion langsamer skaliert als die Nutzung wächst.
AI Accelerators Face Fixed Memory Limits
Jeder KI-Accelerator wird mit einer festen Menge an Hochgeschwindigkeitsspeicher ausgeliefert, die nach dem Deployment nicht erweitert werden kann. Laut Zeitgeist trägt ein Standard-Chip vom Typ H100 80 GB HBM; neuere Generationen bieten bis zu 192 GB, und das künftige B300 soll 288 GB haben. Diese Obergrenze bestimmt, wie viele Anfragen ein einzelner Accelerator gleichzeitig verarbeiten kann.
Der Analyst erklärte, dass die Hauptspeicherlast nicht von den Modellgewichten kommt, sondern vom KV-Cache – dem Sitzungs-Speicher, der mit jedem generierten Token wächst. Zeitgeist berechnete, dass eine Sitzung mit einem 128.000-Token-Kontext ungefähr 20 GB Speicher benötigt. Damit würden bereits vier solcher Sitzungen die Ressourcen eines einzelnen H100 vollständig ausschöpfen. Fortgeschrittene Modelle wie Claude Opus 4,8 oder GPT-5,5 erfordern laut Analyst 40 GB bis 100 GB für eine einzelne lange Anfrage.
Analyst Calculates 60x Memory Shortfall From Agent Adoption
Zeitgeist machte den Wechsel von einfachen Chatbots zu KI-Agenten als zentralen Treiber der Speichernachfrage aus. Während eine normale Frage nur eine geringe Speicherbelastung verursacht, kann ein Agent, der eigenständig Tools aufruft und dabei Kontext ansammelt, leicht 100.000 Token oder mehr erreichen. Der Analyst berechnete, dass ein einzelner Wissensarbeiter, der zehn solcher Agenten parallel laufen lässt, ungefähr 152 GB Speicher benötigen würde.
Zeitgeist stellte fest, dass es weltweit rund 250 Millionen Wissensarbeiter gibt. Der Analyst schätzte, dass bei 100 agentischen Sitzungen pro Person und Tag die Welt ungefähr 60-mal mehr Speicher benötigen würde, als im Jahr 2026 produziert werden kann. Zeitgeist räumte ein, dass neue Aufmerksamkeitsmethoden den Speicherverbrauch um das Vier- bis Achtfache senken können, erklärte jedoch, dass die Nachfrage schneller wächst, da Agenten einfache Chats ersetzen, sich die Kontextfenster von 128.000 auf 10 Millionen Token ausweiten und die KI-Nutzung pro Mitarbeiter von null hin zu hunderten Sitzungen geht.
SK Hynix Overtakes Samsung as AI Memory Demand Surges
Der südkoreanische Speicherhersteller SK Hynix überholte Samsung als das wertvollste börsennotierte Unternehmen des Landes. Auslöser dafür war seine Position bei HBM-Speicherchips, die für KI-Workloads eingesetzt werden. Zeitgeist erklärte, dass dieser Wandel die These stützt, dass Speicherproduzenten zu den großen Nutznießern des Wettrennens um die KI-Infrastruktur werden. Unternehmen, die in der Lage sind, fortschrittliche Speicherchips zu produzieren, könnten deutlich an Umsatz und Bewertung gewinnen, sobald die HBM-Nachfrage schneller wächst als das Angebot.
FAQ
Was hat Analyst Zeitgeist über die Bewertung von Speicherchip-Aktien gesagt?
Zeitgeist erklärte, dass die Aktien von Speicherherstellern sich von den aktuellen Niveaus aus um das Zehnfache erhöhen könnten, wenn sie nach den tatsächlichen Rechenanforderungen und nicht nach historischen Hochständen bewertet würden. Er verwies dabei auf eine Nachfrage nach KI-Speicher, die die globale Produktionskapazität um ein Vielfaches übersteigt.
Wie viel Speicher benötigt eine KI-Agenten-Sitzung laut Zeitgeist?
Zeitgeist berechnete, dass eine Sitzung mit einem 128.000-Token-Kontext ungefähr 20 GB Speicher benötigt. Fortgeschrittene Modelle wie Claude Opus 4,8 oder GPT-5,5 erfordern für eine einzelne lange Anfrage 40 GB bis 100 GB. Der Analyst schätzte, dass ein Wissensarbeiter, der zehn parallele Agenten-Sitzungen laufen lässt, ungefähr 152 GB Speicher benötigen würde.