OpenAI und Broadcom präsentieren den Jalapeño-AI-Chip für LLM-Inferenz

2026-06-25 11:03:21

TIA-0,94%

OpenAI und Broadcom haben am 24. Juni 2026 Jalapeño vorgestellt, einen speziell für die Inferenz großer Sprachmodelle entwickelten KI-Beschleunigerchip. Der Chip stellt OpenAIs ersten Intelligence Processor dar und die erste Komponente einer geplanten, gemeinsam von beiden Unternehmen entwickelten Multi-Generationen-Compute-Plattform mit dem erklärten Ziel, die Geschwindigkeit, Effizienz und Zugänglichkeit fortschrittlicher KI-Systeme zu verbessern. Dieser Meilenstein spiegelt eine breitere strategische Ausrichtung wider, bei der OpenAI zunehmend darauf hinarbeitet, die Kontrolle über den gesamten Infrastruktur-Stack zu übernehmen, der seinen Modellen und Anwendungen zugrunde liegt, anstatt sich ausschließlich auf externe Compute-Plattformen zu verlassen.

Jalapeño-Architektur und technische Spezifikationen

Jalapeño wurde von Grund auf auf der Grundlage interner Forschung zu den Anforderungen moderner LLM-Inferenz entwickelt. Seine Architektur spiegelt Erkenntnisse aus der Modellentwicklungs-Roadmap von OpenAI wider, einschließlich Überlegungen zu Kernel-Optimierung, Speicherverwaltung, Netzwerk- und Serving-Systemen. Der Chip wurde in Partnerschaft mit Broadcom und Celestia entwickelt, die zu Fertigungsprozessen, Board- und Rack-Integration, Netzwerksystemen und der Infrastruktur für die großflächige Bereitstellung beigetragen haben. Laut den Unternehmen soll das Design flexibel für verschiedene große Sprachmodelle bleiben und nicht auf eine einzelne Architektur oder Produktlinie beschränkt sein.

Erste technische Muster laufen bereits mit Machine-Learning-Workloads in Laborumgebungen bei der angestrebten Betriebsfrequenz und Leistungsaufnahme, einschließlich Workloads im Zusammenhang mit fortschrittlichen Modellen wie GPT-5.3-Codex-Spark. Erste interne Evaluierungen deuten darauf hin, dass Jalapeño im Vergleich zu bestehenden führenden KI-Beschleunigern eine verbesserte Leistung pro Watt erzielen könnte. Die Architektur legt nach eigenen Angaben Wert auf reduzierte Datenbewegungen und eine ausgewogenere Verteilung von Rechen-, Speicher- und Netzwerkressourcen, mit dem Ziel, die reale Auslastung näher an die theoretischen Hardware-Grenzen zu bringen. Broadcoms Siliziumtechnologien, einschließlich seiner Tomahawk-Netzwerkkomponenten, werden als Schlüsselfaktoren für die großflächige Bereitstellung positioniert.

Rollen der Partnerschaft mit Broadcom und Celestia

Der Chip wurde in Partnerschaft mit Broadcom und Celestia entwickelt. Broadcom trug Siliziumtechnologien und Netzwerkkomponenten bei, darunter Tomahawk-Netzwerksysteme. Celestia trug zu Fertigungsprozessen, Board- und Rack-Integration, Netzwerksystemen und der Infrastruktur für die großflächige Bereitstellung bei. Das Design basiert auf Produktionssystemen, die in Produkten wie ChatGPT, Codex und API-basierten Diensten verwendet werden, sowie auf den erwarteten Anforderungen zukünftiger agentenbasierter Anwendungen.

OpenAIs Strategie zur Integration der Full-Stack-Infrastruktur

Das Unternehmen hat die Entwicklung als Teil eines breiteren Wandels hin zu einem computergesteuerten Wirtschaftsmodell dargestellt. In diesem Zusammenhang wird der Chip als ein Versuch präsentiert, die Verfügbarkeit von Computerressourcen zu erhöhen, die Betriebskosten zu senken und die Reaktionsfähigkeit von KI-Systemen in Verbraucher- und Unternehmensanwendungen zu verbessern. Die zugrundeliegende Strategie beinhaltet eine engere Integration zwischen Modellentwicklung, Hardware-Design und Infrastruktur-Bereitstellung, um eine Optimierung über das gesamte System hinweg zu ermöglichen, anstatt nur innerhalb isolierter Komponenten.

Der Engineering-Ansatz hinter Jalapeño ist stark auf LLM-Inferenz spezialisiert und nicht auf allgemeine Rechenworkloads. Er basiert auf Produktionssystemen, die in Produkten wie ChatGPT, Codex und API-basierten Diensten verwendet werden, sowie auf den erwarteten Anforderungen zukünftiger agentenbasierter Anwendungen. Das Designziel besteht darin, hohen Durchsatz mit reduzierter Latenz zu kombinieren, um eine reaktionsschnellere Leistung für interaktive KI-Anwendungsfälle im großen Maßstab zu ermöglichen.

Ein zentraler Aspekt des Programms ist das Co-Design von Software- und Hardwaresystemen, bei dem Modelle und Infrastruktur gemeinsam weiterentwickelt werden. Dies umfasst Chip-Architektur, Speichersysteme, Netzwerkschichten, Scheduling-Mechanismen und Bereitstellungs-Frameworks. Durch die Abstimmung dieser Komponenten soll das System die Effizienz verbessern und die Kosten pro Einheit der gelieferten Intelligenz senken.

Die breitere Plattformstrategie positioniert Jalapeño als ersten Schritt einer langfristigen Infrastruktur-Roadmap, die ab 2026 stufenweise ausgerollt werden soll und Beiträge von Broadcom in den Bereichen Silizium und Netzwerke sowie von Celestia bei der Systemintegration umfasst.

FAQ

Was haben OpenAI und Broadcom am 24. Juni 2026 angekündigt?

OpenAI und Broadcom haben Jalapeño angekündigt, einen speziell für die Inferenz großer Sprachmodelle entwickelten KI-Beschleunigerchip. Der Chip stellt OpenAIs ersten Intelligence Processor dar und die erste Komponente einer geplanten, gemeinsam von beiden Unternehmen entwickelten Multi-Generationen-Compute-Plattform.

Welche Workloads laufen auf den ersten technischen Mustern von Jalapeño?

Wann soll die stufenweise Bereitstellung von Jalapeño beginnen?

Die breitere Plattformstrategie positioniert Jalapeño als ersten Schritt einer langfristigen Infrastruktur-Roadmap, die ab 2026 stufenweise ausgerollt werden soll.

View Source

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.