DeepSeek V4 déclenche un débat aux États-Unis : un think tank remet en question l’usage des puces, le PDG de Replit défend l’innovation ouverte

Message de Gate News, 24 avril — Un débat a éclaté aux États-Unis au sujet des capacités technologiques et de la conformité de DeepSeek V4. Chris McGuire, senior fellow au Council on Foreign Relations (CFR) et ancien responsable du Conseil de sécurité nationale de la Maison-Blanche ainsi qu du département de la Défense, a publié une analyse soutenant que V4 n’a pas modifié le paysage concurrentiel de l’IA entre les États-Unis et la Chine. D’après McGuire, le propre rapport V4 de DeepSeek reconnaît que ses capacités de raisonnement accusent un retard d’environ 3 à 6 mois par rapport aux modèles de pointe, avec des benchmarks face à GPT-5.2 et Gemini 3.0 Pro sortis six mois plus tôt.

McGuire a soulevé des inquiétudes : si le rapport V4 divulgue une adaptation au stade de l’inférence vers les GPU NVIDIA et les NPU Huawei Ascend, il ne précise pas publiquement les modèles de GPU ni les coûts d’entraînement utilisés pendant le développement. Il s’est demandé si ce silence suggère l’utilisation de puces NVIDIA Blackwell contrôlées à l’export, notant que V3 avait auparavant affirmé utiliser 2,000 GPU H800 pour un coût de 5,57 millions de dollars. DeepSeek a nié avoir utilisé Blackwell, affirmant que le modèle a été entraîné sur des processeurs NVIDIA H800 et Huawei Ascend 910C.

Le PDG de Replit, Amjad Masad, a répliqué à l’analyse de McGuire, soutenant que des scientifiques chinois partagent publiquement de véritables avancées en IA tandis que des responsables politiques et des lobbyistes américains amplifient les inquiétudes de « distillation de la Chine ». Masad a mis en avant des innovations d’architecture divulguées dans les déclarations officielles de DeepSeek, notamment la compression de l’attention au niveau des tokens (DeepSeek Sparse Attention) et des améliorations d’efficacité significatives pour le calcul en contexte long. Il a indiqué que V4-Pro affiche une inférence par token et des besoins de cache KV nettement inférieurs à des longueurs de contexte de 1M par rapport à V3.2, soulignant que ces avancées d’architecture n’ont rien à voir avec la distillation des données d’entraînement et que l’ensemble des chercheurs, y compris des laboratoires américains, peuvent bénéficier de développements open source.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

La startup d’IA dans la conception architecturale Illoca lève 13 millions de dollars, comment le fondateur taïwanais restitue-t-il la créativité aux architectes ?

La start-up américaine d’architecture conçue par IA Illoca, fondée par deux cofondateurs d’origine taïwanaise, a annoncé le 6 mai 2026 avoir finalisé une levée de fonds de 13 millions de dollars en amorçage, menée par Bessemer Venture Partners, avec la participation de AIX Ventures, Root Ventures et Alt Ventures. Illoca se positionne autour d’un « moteur de conception natif de l’IA », avec pour objectif de rendre le contrôle de la création aux architectes et de résoudre un « trou noir de productivité » qui hante le secteur depuis des décennies. (Claude

ChainNewsAbmediaIl y a 8m

Google et Naver font passer la publicité en direction d’outils de recherche IA ; le chiffre d’affaires de Naver au T1 augmente de 16,3 % à 2,22 milliards de dollars

Selon The Korea Times, Google et Naver déplacent des annonces vers des outils de recherche par IA, tandis que l’IA générative transforme les habitudes de recherche et fait grimper les coûts de calcul. Google signale une ouverture aux publicités dans Gemini, tandis que Naver prévoit de tester des annonces au format « réponse » dans son produit AI Briefing au deuxième trimestre. Naver

GateNewsIl y a 21m

Samsung interrompt les ventes d’appareils électroménagers en Chine pour se recentrer sur l’IA

Samsung Electronics a annoncé le 6 mai qu’elle cessera la vente d’appareils électroménagers dans la Chine continentale, selon le South China Morning Post. Le retrait concerne les téléviseurs, réfrigérateurs, climatiseurs, machines à laver, sèche-linges, aspirateurs et purificateurs d’air, alors que la société réoriente ses priorités stratégiques vers

CryptoFrontierIl y a 21m

Reid Hoffman : les agents d’IA auront besoin de systèmes de confiance crypto

Reid Hoffman, associé chez Greylock et cofondateur de LinkedIn, a déclaré que les agents autonomes auront besoin de systèmes de confiance basés sur la crypto pour effectuer des transactions à travers le réseau ouvert, suggérant que ce développement pourrait permettre un retour en force des NFT. La déclaration de Hoffman relie l’émergence des agents autonomes à la

CryptoFrontierIl y a 21m

SoftBank bondit de 16,5% alors que la hausse des puces d’IA soutient les actions japonaises le 7 mai

D’après CNBC, SoftBank Group a progressé de 16,5 % le 7 mai après la réouverture des marchés japonais, suite à la pause de la Golden Week. Les gains sont intervenus alors que les investisseurs se sont portés vers une hausse mondiale des valeurs liées à l’IA et aux puces, ce qui a propulsé le Nikkei 225 vers un niveau record. Advantest a grimpé de 7,8 %, Tokyo Electron a gagné 9,2 %, et Renesas

GateNewsIl y a 41m

Le PDG d’Anthropic l’a confirmé en personne : la croissance de 80 fois au T1, et pourquoi il faut s’emparer de toute la puissance de calcul de SpaceX

Le PDG d’Anthropic, Dario Amodei, a déclaré lors de la conférence Code with Claude que, pour le T1, les revenus annualisés et l’utilisation étaient prévus avec une croissance de 10 fois, mais qu’ils ont finalement augmenté de 80 fois ; il a qualifié cela de « fou, trop difficile à gérer », tout en indiquant qu’il accélérerait la mise à disposition de davantage de puissance de calcul et qu’il assouplirait les limites imposées aux utilisateurs. Le même jour, il a également annoncé avoir obtenu l’intégralité de la puissance de calcul de SpaceX Colossus 1 (environ 300+ MW, 220 000 GPU NVIDIA), avec une mise en ligne prévue dans un délai d’un mois, afin de fournir un contexte commercial à cette croissance. Aucun montant précis n’a encore été communiqué, les prochains résultats financiers devant confirmer le multiple.

ChainNewsAbmediaIl y a 47m
Commentaire
0/400
Aucun commentaire