Gate News, le 16 mars, la société de modèles mondiaux AMI Labs, qui a récemment levé 1,03 milliard de dollars lors d’un tour de financement seed, a vu son co-fondateur et directeur scientifique, ainsi que co-auteur de l’article sur Diffusion Transformer (DiT), Xie Saining, accorder pour la première fois une longue interview publique. Xie Saining a critiqué de manière systématique la voie actuelle de l’IA centrée sur les grands modèles de langage, estimant que les LLM ne représentent pas la réussite du « Bitter Lesson » proposée par Richard Sutton, voire qu’ils sont « en quelque sorte l’antithèse du Bitter Lesson ». Il a souligné que le langage lui-même est une structure hautement raffinée de la civilisation humaine, équivalant à une « raccourci », et qu’une dépendance excessive limiterait l’apprentissage de l’IA du monde réel. Il a distingué le modèle mondial du modèle linguistique : le modèle linguistique prédit le « prochain token », tandis que le modèle mondial, basé sur l’action, prédit le « prochain état », permettant d’anticiper les conséquences des comportements lors de la phase de raisonnement, ce qui rend l’intelligence plus sûre et contrôlable. Il a également déclaré que « l’AGI est un faux problème », soulignant qu’il est plus difficile de créer un agent capable de survivre dans le monde réel que de résoudre des concours de mathématiques ou d’écrire du code. Xie Saining a aussi révélé avoir refusé à deux reprises l’invitation d’Ilya Sutskever : en 2018, il a abandonné l’idée de rejoindre OpenAI pour choisir Meta FAIR, et en 2024, il a poliment décliné l’offre de sa nouvelle société SSI, en raison de divergences sur les approches multimodale et visuelle. Il a indiqué qu’AMI Labs évitait délibérément d’avoir un bureau dans la Silicon Valley, car « la Silicon Valley est déjà profondément engagée dans la voie des LLM ». Le siège de l’entreprise est situé à Paris, et elle collecte des données du monde réel via des partenaires mondiaux. Il pense que le paradigme de formation de l’IA évolue du « téléchargement d’Internet » vers le « téléchargement de l’humain », avec à court terme comme scénarios d’application des lunettes intelligentes et des robots.