Les entrepreneurs qui utilisent le calcul « remplacer les effectifs humains par l’IA pour réduire les coûts » modifient désormais les règles du jeu, et Anthropic en a fait un autre. Ce géant de l’IA a récemment mis à jour la structure de facturation de la version entreprise de Claude. Il a dissocié l’utilisation de Claude, Claude Code et Cowork, qui auparavant faisait l’objet d’un abonnement mensuel à 40 dollars, afin de la remplacer par une facturation distincte selon le nombre de Token réellement consommés. Désormais, il semble que le coût des employés IA ne soit pas aussi faible que ce que l’on dit à l’extérieur.
(Peut-on économiser des Token avec un style de langue classique et une conversation avec l’IA ? Un screenshot a déclenché le débat. Un ingénieur : en réalité, c’est l’anglais qui règne.)
La fin de l’ère des tarifs forfaitaires : modification de la facturation de la version entreprise de Claude, vous payez ce que vous utilisez
Selon le rapport de The Information, les documents d’information d’entreprise mis à jour par Anthropic indiquent : « Les frais mensuels pour les sièges (seats) couvrent uniquement l’accès à la plateforme, sans inclure aucun usage ; toutes les utilisations sont facturées séparément au tarif standard des API. » Auparavant, les entreprises achetaient un « forfait illimité ». Désormais, c’est « à la carte ».
Dans l’ancien régime, pour chaque compte d’entreprise, les frais d’abonnement mensuels s’élevaient à environ 40 à 200 dollars, avec en plus une remise API de 10 % à 15 %. Bien que le nouveau régime réduise l’abonnement à 20 dollars par mois, il annule simultanément toutes les remises API et oblige les entreprises à s’engager à l’avance et à prépayer la quantité mensuelle de Token estimée. Peu importe d’utiliser plus ou moins, le montant engagé reste dû, et un volume plus élevé ne donne pas droit à un prix unitaire plus faible.
Cette architecture est une source de revenus récurrents annuels prévisible pour Anthropic ; pour les entreprises, il s’agit d’un report des coûts liés à l’usage et des risques.
Le véritable détonateur derrière l’ajustement des prix : la pénurie de ressources de calcul
Anthropic qualifie ce changement de « optimisation produit », mais la force motrice en coulisses est le coût élevé des ressources de calcul. Même si le chiffre d’affaires annualisé d’Anthropic est passé en seulement quatre mois de 9 milliards de dollars à 30 milliards de dollars, ce que reçoivent les utilisateurs n’est pas une réduction : c’est une restructuration de la structure des revenus.
Le cœur du problème réside dans la façon dont (l’Agent IA) consomme l’énergie. Une conversation classique consomme « en petites gorgées », tandis que les flux de travail d’agents incluant des tâches en plusieurs étapes, des exécutions répétées, voire une collaboration entre plusieurs agents, ressemblent davantage à « de grandes rasades ».
Le goulot se serre aussi du côté de l’offre. Le prix de location des GPU Blackwell a augmenté de 48 % en deux mois. CoreWeave a augmenté ses prix de plus de 20 % depuis la fin de l’année dernière. Et selon les prévisions des banques américaines, la demande en capacité de calcul continuera à se contracter jusqu’en 2029. Les revenus générés par les tarifs forfaitaires ne suffisent plus depuis longtemps à faire face à la charge d’Anthropic.
L’instabilité du service : le vrai voyant d’alerte pour les clients entreprises
En plus de cela, la stabilité du service est également un gros problème. Le fondateur de Retool, David Hsu, a indiqué via le Wall Street Journal que, même si Claude Opus 4.6 est meilleur que OpenAI, il a finalement déplacé ses flux de travail vers ce dernier. La raison : le service de Claude interrompt fréquemment ses activités, ce qui l’empêche souvent de livrer le code à temps.
Sur les 90 jours allant jusqu’au 8 avril de cette année, le temps de bon fonctionnement de l’API Anthropic n’a atteint que 98,95 %, bien en dessous de la norme de 99,99 % de l’industrie. L’initiative de Hsu illustre une chose : dans le choix entre la fiabilité du service et les capacités du modèle, ce dont les entreprises ont besoin, c’est d’une IA stable.
Le coût réel des employés IA est bien plus complexe que les chiffres de la facture
Désormais, le modèle de tarification basé sur le « forfait d’abonnement mensuel » appartient au passé. Le coût total sera recalculé à partir de l’usage réel des Token. Revendiquer des remises sur l’usage ou des clauses d’ajustement de flexibilité dans les contrats, ou encore contrôler activement les dépenses en optimisant les Prompts, en traitant par lots et en mettant en place des stratégies de cache, devient la nouvelle matière pour les entreprises qui passent à l’IA et se transforment.
Il y a quelques jours, OpenAI a aussi annoncé qu’il allait passer Codex à une facturation par Token. GitHub a également resserré les limites d’usage de Copilot le 10 avril. Quant à Windsurf, il a remplacé le système de points par des quotas quotidiens. L’ensemble de l’industrie de l’IA annonce en même temps la fin de l’ère des tarifs forfaitaires.
Avant d’évaluer « combien d’emplois l’on peut économiser en adoptant l’IA », il faut peut-être aussi vérifier si les utilisateurs peuvent produire des œuvres stables et de haute qualité dans un budget limité.
Cet article sur la version entreprise d’Anthropic Claude, qui a été l’un des premiers à passer à la facturation à l’usage, est-ce que les employés IA économisent vraiment de l’argent ? Est apparu en premier sur la chaîne ABMedia.
Articles similaires
Réalité des agents IA de la Silicon Valley : énorme gaspillage de jetons, intégration système « extrêmement chaotique », la « prochaine version de ChatGPT » selon Jensen Huang encore à confirmer
L’IA engloutit 80% du capital-risque mondial, Q1 2026 attire 242 milliards de dollars : comment les acteurs de la cryptographie doivent réagir à la réallocation des capitaux
La police de Hong Kong met en garde contre l’arnaque crypto « trading quantitatif par IA », une femme perd 7,7 millions de HK$
Hong Kong annoncera demain la sixième série de la liste des entreprises clés
Le robot Lightning d’Honor remporte le semi-marathon de robots humanoïdes de Pékin 2026 avec un temps de 50:26
L’action de Meta progresse de 1,73 % tandis que la société prévoit un plan de licenciement de 8 000 emplois à partir du 20 mai