Titre original : « Some thoughts ahead of Nvidia tonight » Auteur : @GavinSBaker Traducteur : Peggy, BlockBeats
Note de l’éditeur : Après la publication des résultats financiers de Nvidia, l’attention du marché se concentre généralement sur le chiffre d’affaires, le bénéfice et les prévisions. Mais l’auteur de cet article, @GavinSBaker, tente de ramener la discussion à une perspective à plus long terme : ce qui détermine la valeur de Nvidia, ce n’est pas les données d’un trimestre, mais la durée pendant laquelle la demande en IA pourra se maintenir, et si l’investissement en capacité de calcul génère réellement des retours durables.
En partant de l’expérience historique des cycles technologiques, l’article discute si une « bulle » ou une « surconstruction » pourrait se reproduire, tout en soulignant que cette phase d’IA actuelle est confrontée à des contraintes d’électricité et de wafers, ce qui pourrait ralentir le rythme d’expansion. D’autre part, le prix de location des GPU et le taux d’utilisation élevé des anciens modèles offrent une validation concrète du « ROI IA ».
Voici la traduction intégrale :
Voici quelques observations personnelles, qui pourraient être utiles à ceux qui suivent Nvidia. À mon avis, il n’y a que deux variables clés réellement dignes d’intérêt autour de cette entreprise : d’une part, la durabilité de la demande, et d’autre part, le retour sur investissement (ROI) de l’IA, qui est étroitement lié à la durée de vie utile des GPU.
Durabilité de la demande : l’histoire se répétera-t-elle ?
D’après l’expérience des cycles technologiques, presque tous ont connu des bulles financières et une surcapacité d’expansion. Carlota Perez en parle systématiquement dans « Technological Revolutions and Financial Capital ». Elle souligne que, lors de chaque révolution technologique — que ce soit le chemin de fer, la radio ou Internet — les marchés financiers détectent tôt leur potentiel à long terme, mais la frénésie de capitaux qui en découle tend à créer des bulles (ce que Mauboussin qualifie aussi de « collapse de la diversité des opinions »). La bulle entraîne une surconstruction, qui provoque un recul de la demande à un stade donné, puis un effondrement du marché ; mais l’excès d’offre dans la technologie de base finit par poser les bases d’une « ère dorée ». La trajectoire du développement d’Internet en est un exemple typique.
Pour Nvidia, l’essentiel ne réside pas dans ses résultats trimestriels ou ses prévisions, qui sont souvent anticipés par les investisseurs institutionnels. Ce qui compte vraiment, c’est la pérennité du bénéfice par action (EPS), et non la pente de croissance de l’année en cours.
Selon les attentes implicites dans la valorisation actuelle, le marché semble exprimer une hypothèse : Nvidia pourrait approcher un pic temporaire de profitabilité, avec une inquiétude sous-jacente concernant une sur-expansion des investissements en capital. Il faut souligner que la préoccupation du marché ne porte pas sur une « bulle de valorisation », mais sur une « bulle fondamentale », c’est-à-dire un risque de surconstruction potentielle alimentée par les capex. Si le marché peut croire en la capacité de Nvidia à maintenir une croissance annuelle composée (CAGR) à deux chiffres après 2027, la valorisation pourrait se stabiliser.
Cette fois, la situation est-elle vraiment différente ?
L’expression « cette fois, c’est différent » est souvent une erreur de jugement. Mais cette phase d’IA présente effectivement des différences : à l’échelle mondiale, des contraintes substantielles existent en termes d’électricité (watts) et de wafers de procédé avancé, et leur résolution pourrait prendre plusieurs années.
Ces contraintes du côté de l’offre pourraient en fait freiner la surcapacité. Les grands fournisseurs de cloud, si les conditions le permettent, pourraient continuer à augmenter leur capacité, mais la réalité de l’électricité et des wafers limite leur rythme d’expansion. Contrairement à ce que décrit Perez dans son livre sur les révolutions technologiques, il n’existait pas à l’époque de telles contraintes d’offre pour limiter la vitesse de déploiement.
Sans surconstruction, un effondrement serait difficile, surtout dans un contexte où la valorisation des techs n’est pas extrême.
Parmi ces deux contraintes, la capacité de wafers pourrait être plus critique que l’électricité. La maîtrise du rythme de production des wafers pourrait devenir un facteur clé pour prolonger la phase d’IA. La direction de TSMC, connue pour sa prudence, privilégie la stabilité industrielle et la valeur à long terme plutôt que la croissance agressive à court terme. Sans ces contraintes d’électricité et de wafers, la croissance de Nvidia dans les 24 prochains mois pourrait être plus rapide, mais le risque de surconstruction augmenterait également.
En un sens, ces contraintes d’offre pourraient en fait « ralentir » la phase d’IA, stabilisant le cycle. La forte dépendance de l’IA aux wafers de procédé avancé pourrait même être un facteur clé pour éviter des fluctuations extrêmes dans cette phase.
Pour atteindre certains scénarios extrêmes, la capacité de calcul pourrait devoir être multipliée par plusieurs centaines, voire mille. La durée nécessaire pour cette expansion offrirait un tampon pour l’ajustement social et la mise en place de régulations.
L’expérience historique fournit aussi des repères : après l’invention de la machine à vapeur rotative par James Watt, il a fallu plusieurs décennies pour que le réseau ferroviaire remplace le cheval. La vitesse d’évolution de l’IA pourrait être plus rapide, mais il est peu probable qu’une transformation sociale complète se fasse en un temps très court.
Plus important encore, l’humanité n’a besoin que de 20 à 30 watts pour atteindre une « intelligence générale ». Dans un monde limité en électricité, cette efficacité pourrait durer longtemps. Par conséquent, un cycle d’IA plus fluide et durable pourrait ne pas être une mauvaise chose pour la société.
Durée de vie des GPU et vrai ROI de l’IA
Le prix de location des GPU reflète essentiellement la valeur économique du token, qui est aussi un indicateur central du « ROI IA ». En théorie, avec le lancement continu de GPU plus performants, le prix de location des anciens modèles devrait progressivement baisser, même si le ROI de l’IA reste positif.
Cependant, ces deux derniers mois, le prix de location du H100, en service depuis près de quatre ans, a connu une hausse notable. Cela indique que, notamment dans les scénarios d’IA agentique et de génération de code, la puissance de calcul génère une valeur économique réelle et significative.
Par ailleurs, même avec le lancement de Blackwell, le A100, lancé il y a six ans, maintient un taux d’utilisation élevé, sans baisse notable de prix de location. Cela suggère que la durée de vie utile effective des GPU pourrait dépasser six ans, voire dépasser la période d’amortissement de la majorité des clients.
Ce constat a un impact structurel : si la valeur résiduelle est plus élevée que prévu, le coût de financement des GPU diminue. À l’inverse, pour des ASIC conçus pour un modèle ou une utilisation spécifique, il est difficile d’obtenir un avantage similaire en termes de cycle de vie. Dans un environnement à évolution rapide, la capitalisation des ASIC spécialisés est plus coûteuse, rendant leur financement plus difficile.
Dans une certaine mesure, la flexibilité est la barrière naturelle des GPU. Avec la séparation des fonctions de pré-remplissage (prefill) et de décodage (decode), et la montée en puissance de l’écosystème de puces associées, l’architecture de calcul évolue d’une « logique à puce unique » vers un « système multi-puces collaboratif ». L’infrastructure IA ne dépend plus d’un seul composant, mais d’un système intégré et hautement couplé.
Avec la déconnexion entre pré-remplissage et décodage, l’écosystème Nvidia pourrait achever sa restructuration plus tôt que celui de TPU. La divergence dans les choix de conception des différents fabricants modifie la position relative des clients en termes de coûts d’inférence.
Si certains fabricants ont auparavant utilisé leur avantage de coût pour réduire le prix du token et gagner des parts de marché, la diminution de cet avantage rendra le marché plus rationnel. Sur le long terme, cela pourrait améliorer le ROI IA, notamment lors du passage de la formation à l’inférence.
Ce tournant pourrait être plus significatif que n’importe quel résultat trimestriel.
Une dernière petite note optimiste : j’espère que Nvidia pourra à nouveau utiliser des super-héros comme noms de code pour ses puces. Étonnamment, la « campagne verte » n’a pas encore utilisé le nom « Banner » (le vrai nom de Hulk dans Marvel).