Karpathy : des lacunes graves apparaissent dans la compréhension des capacités de l’IA ; la version gratuite et l’agent de pointe sont « des produits entièrement différents »

Ancien directeur de l’IA chez Tesla, membre fondateur d’OpenAI, Andrej Karpathy, a publié ce 9 avril sur X un long billet dans lequel il explique que la perception du public des capacités de l’IA est en train de se scinder de manière grave. Il estime que les personnes qui utilisent ChatGPT dans sa version gratuite et les techniciens qui utilisent chaque jour des outils d’agent de pointe comme Codex ou Claude Code discutent en réalité de « produits entièrement différents », mais que les deux parties pensent voir, chacune, l’intégralité du visage de l’IA.

Deux mondes, deux perceptions de l’IA

Karpathy classe les utilisateurs actuels de l’IA en deux groupes.

Le premier groupe : à un moment donné l’an dernier, des personnes ont essayé la version gratuite de ChatGPT, puis se sont forgé une impression globale de l’IA. Elles voient toutes sortes d’erreurs du modèle — hallucinations, résultats de recherche absurdes, et même des questions simples comme « faut-il prendre la voiture ou aller à la laverie à pied » qui tournent mal. Karpathy reconnaît que ces problèmes existent bel et bien, mais souligne que la version gratuite et des modèles dépassés ne peuvent pas représenter les véritables capacités des modèles d’agent de pointe avant 2026.

Le deuxième groupe réunit simultanément deux conditions : utiliser de façon payante les tout derniers modèles d’agent de pointe (comme OpenAI Codex ou Claude Code) et s’en servir professionnellement dans des domaines techniques comme le développement logiciel, les mathématiques et la recherche. Karpathy dit que ces personnes vivent un choc psychique élevé de « psychose de l’IA » (AI Psychosis), car les progrès récents de ces modèles dans les domaines techniques « ne peuvent être décrits que comme stupéfiants » — vous pouvez littéralement voir comment ils résolvent en une heure des problèmes d’architecture logicielle qui prenaient auparavant quelques jours, voire quelques semaines.

Pourquoi les progrès se concentrent dans les domaines techniques

Karpathy explique pourquoi l’amélioration des capacités de l’IA est particulièrement marquée dans des domaines techniques comme le développement de programmes, alors qu’elle l’est moins dans des usages généraux tels que la recherche, la rédaction ou les recommandations.

Il y a deux raisons : premièrement, les domaines techniques fournissent des fonctions de récompense vérifiables (par exemple, si les tests unitaires passent), ce qui permet à l’entraînement par apprentissage par renforcement de fonctionner efficacement ; en revanche, pour la qualité d’un texte, il est difficile de déterminer clairement le bon ou le mauvais. Deuxièmement, les domaines techniques ont une plus grande valeur commerciale dans des contextes B2B, de sorte que les entreprises d’IA investissent la plus grande part de leurs ressources d’équipe dans ces directions.

Deux groupes ne comprennent pas ce que dit l’autre

Karpathy conclut que ces deux groupes « parlent chacun de leur côté ». Le mode vocal de la version gratuite d’OpenAI qui rate des problèmes du quotidien, et le Codex de la version payante la plus haut de gamme d’OpenAI qui, en une heure, restructure tout un dépôt de code ou découvre des failles du système — les deux choses sont vraies en même temps.

Dans ses réponses ultérieures, il ajoute que quelqu’un lui a proposé ce point de vue : si l’affaire OpenClaw a suscité autant d’attention sociale, c’est précisément parce qu’elle a amené un grand nombre de non-techniciens à découvrir pour la première fois les tout derniers modèles d’agent, alors que ces personnes savaient auparavant seulement que l’IA équivaut à ChatGPT, la version web.

Cet article de Karpathy : « Les capacités de l’IA présentent de graves fractures de perception ; la version gratuite et l’agent de pointe sont “des produits entièrement différents” » est apparu pour la première fois sur Chaîne News ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Prophet lance un marché de prédiction alimenté par l’IA avec une tranche de trading en direct de 10 000 dollars aujourd’hui

Selon MetaversePost, Prophet a lancé aujourd’hui (6 mai) un marché de prédiction alimenté par l’IA, avec 10 000 dollars en USDC alloués à la négociation en direct. Les utilisateurs peuvent trader directement contre un contrepartie IA qui génère des prix basés sur des probabilités pour chaque marché, certains contrats étant réglés dans les 24

GateNewsIl y a 6h

Tessera Labs clôture une levée de fonds de série A menée par a16z ; une équipe d’IA composée de six personnes remplace 60 consultants SAP

D’après Beating, Tessera Labs, une société d’intégration de systèmes d’IA, a finalisé une levée de fonds de Série A menée par a16z. Le nouveau venu, fondé en 2024, utilise une plateforme multi-agents pour automatiser les migrations de SAP ECC vers S/4HANA, traditionnellement nécessaires entre 3 et 5 ans et entre 100 millions de dollars et 500 millions de dollars par

GateNewsIl y a 6h

Le Taiex se maintient au-dessus de 40 000 points, Wall Street atteint un nouveau sommet, mais le secteur de l’IA ne fait-il que commencer à entrer dans une phase initiale ?

Goldman Sachs indique que la demande liée à l’IA augmentera fortement la consommation de tokens grâce à des charges de travail liées aux agents de type « consumer », avec une croissance potentielle de plus de 12 fois d’ici 2030, et des calculs mensuels de tokens pouvant atteindre 60 billions ; la différence entre l’agent non « agent » et le « consumer agent » réside dans l’automatisation de tâches sur des périodes plus longues. Si cela se concrétise, l’IA entrera dans des flux de travail « agentic ». Larry Fink déclare que l’offre de puissance de calcul est fortement insuffisante ; à l’avenir, des contrats à terme sur la puissance de calcul pourraient apparaître, et les deux ensemble soutiendraient la thèse haussière sur les infrastructures de base de l’IA ; l’article estime que l’IA se trouve encore à un stade précoce.

ChainNewsAbmediaIl y a 7h

WLFI 生態 AI 项目 WorldClaw 推出代理作业系统;未披露品牌还能卖 10 000 dollars ?

La famille de Trump relance un nouveau projet crypto : World Liberty Financial (WLFI), qui s’associe à WorldClaw pour lancer le modèle d’interface unifiée WorldRouter, axé sur une plateforme d’agents intégrant 300 modèles d’IA. Le forfait le plus cher est proposé à près de 10 000 dollars, mais le cadeau annoncé est en réalité un appareil matériel « de marque et de système d’exploitation non divulgués », ce qui suscite des inquiétudes. @WorldClawAI étend l’accès à l’IA et $WLFI joue un rôle clé dans l’écosystème. Les utilisateurs peuvent accéder à plus de 300 modèles avec WorldRouter, et les agents peuvent

ChainNewsAbmediaIl y a 10h

Meta développe un assistant IA Hatch pour concurrencer OpenClaw, et prévoit de finaliser les tests en interne d’ici la fin juin

Selon le Financial Times, le 5 mai, Meta développe un assistant IA destiné au grand public (Hatch), inspiré d’OpenClaw, le produit du fabricant OpenAI, avec pour objectif d’achever les tests internes d’ici la fin du mois de juin ; Meta prévoit également, d’ici le quatrième trimestre de cette année, d’intégrer un outil d’achat autonome de type agent à ses services Instagram.

MarketWhisperIl y a 11h

Cloudflare : le trafic non humain est désormais majoritaire, les adresses de la Fondation x402 influencent l’économie Web

Le directeur de la stratégie de Cloudflare a déclaré que plus de la moitié du trafic Internet est désormais non humain, mettant en évidence un changement dans les modes d’utilisation du web, porté par des agents IA. La société cite la x402 Foundation comme une initiative clé visant à construire une infrastructure pour soutenir une économie numérique durable du contenu

CryptoFrontierIl y a 12h
Commentaire
0/400
Aucun commentaire