Message de Gate News, 25 avril — DeepSeek a publié des versions préliminaires de V4-Pro et V4-Flash le 24 avril, deux modèles open-weight avec des fenêtres de contexte d’un million de tokens. V4-Pro dispose de 1,6 billion de paramètres au total, mais n’active que 49 milliards par passe d’inférence en utilisant une architecture de type Mixture-of-Experts. V4-Flash a 284 milliards de paramètres au total, dont 13 milliards activés.
La tarification est nettement plus basse que celle des concurrents : V4-Pro coûte 1,74 $ par million de tokens d’entrée et 3,48 $ par million de tokens de sortie — environ 98 % de moins que le GPT-5.5 Pro d’OpenAI ($30 input, $180 output) et environ un vingtième du coût de Claude Opus 4.7. V4-Flash est facturé 0,14 $ en entrée et 0,28 $ en sortie par million de tokens. Les deux modèles sont open source sous licence MIT et peuvent être exécutés localement gratuitement.
DeepSeek a réalisé des gains d’efficacité grâce à deux nouveaux mécanismes d’attention : Compressed Sparse Attention et Heavily Compressed Attention, qui réduisent les coûts de calcul à 27 % de ceux du prédécesseur V4-Pro (V3.2) et à 10 % pour V4-Flash. La société a partiellement entraîné V4 sur des puces Huawei Ascend, en contournant les restrictions d’exportation américaines sur les processeurs Nvidia avancés. DeepSeek a déclaré qu’une fois que 950 nouveaux supernœuds seront mis en ligne plus tard en 2026, la tarification baissera davantage.
Sur des benchmarks de performance, V4-Pro-Max arrive en première position sur Codeforces compétitif (3,206, se classant autour de la 23e place parmi les candidats humains) et obtenant 90,2 % sur les problèmes de mathématiques d’Apex Shortlist contre 85,9 % pour Claude Opus 4.6. Cependant, il est en retrait sur les benchmarks de multitâche : MMLU-Pro (87,5 % contre 91,0 % de Gemini-3.1-Pro) et Humanity’s Last Exam (37,7 % contre 44,4 %). Sur les tâches à long contexte, V4-Pro mène les modèles open source mais perd face à Claude Opus 4.6 sur les tests de récupération MRCR.
V4-Pro introduit le « interleaved thinking », permettant aux workflows d’agents de conserver le contexte de raisonnement sur plusieurs appels d’outils sans vider entre les étapes. Les deux modèles prennent en charge des intégrations de codage avec Claude Code et OpenCode. D’après une enquête auprès des développeurs de DeepSeek portant sur 85 utilisateurs, 52 % ont déclaré que V4-Pro était prêt comme agent de codage par défaut, et 39 % penchaient pour son adoption. Les anciens endpoints deepseek-chat et deepseek-reasoner seront mis à la retraite le 24 juillet 2026.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Anthropic vise le marché grand public et améliore la vitesse du chatbot Claude
Anthropic change sa stratégie pour le chatbot Claude, en passant de clients axés sur l’entreprise au marché grand public, selon Mike Krieger, codirecteur de l’équipe des laboratoires de l’entreprise. La startup d’IA s’appuie sur les récents progrès du marché grand public afin d’accroître l’attrait du logiciel auprès des utilisateurs généralistes, avec en interne
CryptoFrontierIl y a 13m
La startup d’IA dans la conception architecturale Illoca lève 13 millions de dollars, comment le fondateur taïwanais restitue-t-il la créativité aux architectes ?
La start-up américaine d’architecture conçue par IA Illoca, fondée par deux cofondateurs d’origine taïwanaise, a annoncé le 6 mai 2026 avoir finalisé une levée de fonds de 13 millions de dollars en amorçage, menée par Bessemer Venture Partners, avec la participation de AIX Ventures, Root Ventures et Alt Ventures. Illoca se positionne autour d’un « moteur de conception natif de l’IA », avec pour objectif de rendre le contrôle de la création aux architectes et de résoudre un « trou noir de productivité » qui hante le secteur depuis des décennies.
(Claude
ChainNewsAbmediaIl y a 40m
Google et Naver font passer la publicité en direction d’outils de recherche IA ; le chiffre d’affaires de Naver au T1 augmente de 16,3 % à 2,22 milliards de dollars
Selon The Korea Times, Google et Naver déplacent des annonces vers des outils de recherche par IA, tandis que l’IA générative transforme les habitudes de recherche et fait grimper les coûts de calcul. Google signale une ouverture aux publicités dans Gemini, tandis que Naver prévoit de tester des annonces au format « réponse » dans son produit AI Briefing au deuxième trimestre.
Naver
GateNewsIl y a 53m
Samsung interrompt les ventes d’appareils électroménagers en Chine pour se recentrer sur l’IA
Samsung Electronics a annoncé le 6 mai qu’elle cessera la vente d’appareils électroménagers dans la Chine continentale, selon le South China Morning Post. Le retrait concerne les téléviseurs, réfrigérateurs, climatiseurs, machines à laver, sèche-linges, aspirateurs et purificateurs d’air, alors que la société réoriente ses priorités stratégiques vers
CryptoFrontierIl y a 53m
Reid Hoffman : les agents d’IA auront besoin de systèmes de confiance crypto
Reid Hoffman, associé chez Greylock et cofondateur de LinkedIn, a déclaré que les agents autonomes auront besoin de systèmes de confiance basés sur la crypto pour effectuer des transactions à travers le réseau ouvert, suggérant que ce développement pourrait permettre un retour en force des NFT.
La déclaration de Hoffman relie l’émergence des agents autonomes à la
CryptoFrontierIl y a 54m
SoftBank bondit de 16,5% alors que la hausse des puces d’IA soutient les actions japonaises le 7 mai
D’après CNBC, SoftBank Group a progressé de 16,5 % le 7 mai après la réouverture des marchés japonais, suite à la pause de la Golden Week. Les gains sont intervenus alors que les investisseurs se sont portés vers une hausse mondiale des valeurs liées à l’IA et aux puces, ce qui a propulsé le Nikkei 225 vers un niveau record. Advantest a grimpé de 7,8 %, Tokyo Electron a gagné 9,2 %, et Renesas
GateNewsIl y a 1h