OpenAI a officiellement dévoilé le 24 juin son premier processeur AI développé en interne, le Jalapeño, développé conjointement avec Broadcom. Positionné comme un processeur d’inférence optimisé pour les grands modèles de langage (LLM), il est fabriqué par TSMC, tandis que l’électronique canadienne Celestica construit les systèmes de serveurs. Le PDG de Broadcom, Hock Tan, a déclaré que les performances du Jalapeño sont comparables à celles du Blackwell de Nvidia.
Selon un article officiel d’OpenAI, le Jalapeño est un processeur spécialement conçu pour les besoins d’inférence, et non une puce d’entraînement. Il n’a fallu que 9 mois entre la conception initiale et le tape-out, un délai rendu possible grâce à l’utilisation par OpenAI de ses propres modèles d’IA pour optimiser la conception de la puce.
Richard Ho, responsable du matériel chez OpenAI, a souligné que la puce peut exécuter efficacement les charges de travail critiques ; les premiers tests officiels montrent une efficacité par watt nettement supérieure aux produits comparables sur le marché. Le PDG de Broadcom, Hock Tan, a déclaré que les performances sont comparables au Blackwell de Nvidia et au TPU de Google.
Hock Tan a livré des échantillons physiques du Jalapeño à Sam Altman ; tout en reconnaissant que, étant donné que les puces AI nécessitent beaucoup de mémoire à large bande passante (HBM), la marge bénéficiaire actuelle des puces personnalisées est inférieure à celle de produits comme les commutateurs réseau. La HBM est principalement fournie par SK Hynix et Samsung Electronics.
Il a également souligné que la demande des clients pour la puissance de calcul explose et devrait se poursuivre jusqu’en 2028. Greg Brockman, président d’OpenAI, a déclaré à CNBC que le degré d’accélération du développement de puces par les modèles d’IA est surprenant, et que l’entreprise a un besoin urgent de puissance de calcul.
Le Jalapeño fait partie de la stratégie de calcul diversifiée d’OpenAI. Ben Barringer, responsable de la recherche technologique chez l’investisseur Quilter Cheviot, analyse que les géants de la tech diversifient activement leurs sources de puces pour éviter la dépendance à un seul fournisseur. Outre sa collaboration avec Broadcom, OpenAI a également conclu un accord avec AWS pour utiliser les puces Trainium, et a établi des partenariats avec AMD et Cerebras, qui sera cotée en mai 2026.
OpenAI et Broadcom ont précédemment annoncé leur intention de collaborer avec des partenaires comme Microsoft dans les années à venir pour déployer des centres de données d’une capacité de 10 GW. Ce lancement de puce survient à un moment critique où OpenAI se prépare pour son introduction en bourse (IPO), avec une valorisation attendue sur le marché pouvant atteindre 1 billion de dollars. La puce développée en interne aide à établir un avantage technologique full-stack et à réduire les coûts de service, soutenant ainsi des attentes de valorisation plus élevées.
Le Jalapeño est un piment mexicain au goût extrêmement piquant. Le média technologique Engadget qualifie cela de « début épicé » pour OpenAI dans le domaine des puces ; BusinessKorea souligne que ce nom révèle également qu’OpenAI cible directement le marché des infrastructures de calcul AI monopolisé par Nvidia. Dans l’industrie des semi-conducteurs et du logiciel, les équipes de R&D ont l’habitude d’utiliser des noms de nourriture, de plantes ou de lieux comme noms de code. L’équipe d’OpenAI a utilisé ce nom de code pendant les 9 mois de développement secret et l’a conservé lors du lancement.
Selon les rapports, le Jalapeño est un processeur d’inférence, optimisé pour les besoins d’inférence des grands modèles de langage, et non une puce d’entraînement. L’inférence est le processus par lequel un modèle AI génère des réponses en utilisation réelle, plus sensible à l’efficacité énergétique et à la latence ; l’entraînement nécessite une densité de calcul très élevée. Les premiers tests du Jalapeño montrent une efficacité par watt nettement supérieure aux produits d’inférence comparables.
Selon l’évaluation de l’analyste Ben Barringer, les géants de la tech (y compris OpenAI) diversifient activement leurs sources de puces pour éviter la dépendance à un seul fournisseur. Le lancement du Jalapeño permet à OpenAI de réduire sa dépendance aux GPU de Nvidia, en combinant des approvisionnements diversifiés comme AWS Trainium, AMD et Cerebras pour construire un portefeuille de calcul plus flexible. Cependant, l’échelle et la maturité du Jalapeño en sont encore au stade de déploiement préliminaire, et il est difficile de remplacer complètement la position de marché de Nvidia à court terme.
Actualités associées
OpenAI et Broadcom dévoilent Jalapeño, la première puce IA personnalisée pour l'inférence LLM
Qualcomm dévoile le CPU Dragonfly C1000 pour centre de données, Meta premier client
Cambrian lève un tour de financement seed de $6M pour construire un réseau d'oracles de données blockchain.
OpenAI et Broadcom dévoilent la puce IA personnalisée Jalapeño dédiée à l'inférence
Engram lève $98M pour réduire les coûts des jetons d’IA pour les clients entreprises