Tencent lance Hy3 en version d’aperçu open source, les tests de référence du code améliorent de 40 % par rapport à l’ancienne version

騰訊開源Hy3預覽版

Tencent a ouvert Hy3 en version d’aperçu (large modèle de langage) de manière officielle sur GitHub, Hugging Face et ModelScope le 23 avril, et l’a également mise à disposition sous forme de service d’API payant sur Tencent Cloud. Selon un rapport de Decrypt daté du 24 avril, la version d’aperçu de Hy3 a démarré l’entraînement à la fin du mois de janvier et, à la date de publication, il ne s’est pas écoulé plus de trois mois.

Architecture du modèle Hy3 et contexte de développement

D’après l’annonce officielle de Tencent, la version d’aperçu de Hy3 est une architecture de type “experts mixtes” : elle dirige chaque requête vers un sous-ensemble de réseaux d’experts dédié au lieu d’activer tous les paramètres de manière simultanée, afin de réduire les besoins de calcul.

Le modèle phare de la génération précédente, Hy2, comptait plus de 400 milliards de paramètres. Tencent a déclaré que 295 milliards constituent un réglage optimisé pour l’efficacité d’inférence ; au-delà de ce volume, l’utilité marginale de l’ajout de paramètres ne vaut plus le coût.

Selon le rapport de Decrypt, le travail d’entraînement de Hy3 est mené par le scientifique en chef de l’IA chez Tencent, Yao Shunyu. Après avoir achevé en février 2026 la reconstruction des infrastructures de base pour le pré-entraînement et l’empilement de l’apprentissage par renforcement, l’entraînement de Hy3 a officiellement commencé.

Données de tests de référence clés

D’après les résultats de tests de référence divulgués par l’annonce officielle de Tencent :

SWE-bench Verified (correction de vraies erreurs de code sur GitHub) : Hy3 version d’aperçu 74,4 %, Hy2 53,0 % ; sur la même période GLM-5 77,8 %, Kimi-K2.5 76,8 %, Claude Opus 4,6 80,8 %

Terminal-Bench 2.0 (exécution de tâches à partir de la ligne de commande) : Hy3 version d’aperçu 54,4 %, Hy2 23,2 %

BrowseComp (tâches complexes de recherche web) : Hy3 version d’aperçu 67,1 %, Hy2 28,7 %

WideSearch : Hy3 version d’aperçu 70,2 %, supérieur à GLM-5 et Kimi-K2.5, inférieur à Claude Opus 4,6 de 77,2 %

Examen d’admission au doctorat en mathématiques de l’Université Tsinghua (printemps 2026) : moyenne sur trois sessions (avg@3) 88,4, le meilleur score parmi les modèles chinois

Olympiade chinoise de biologie pour lycéens 2025 (CHSBO 2025) : 87,8 points, le meilleur score parmi les modèles chinois de même catégorie

Plateformes de déploiement et tarification des API

Selon l’annonce officielle de Tencent, la version d’aperçu de Hy3 a été déployée sur les plateformes suivantes : Yuanbao, QQ, Tencent Docs, CodeBuddy, WorkBuddy et OpenClaw.

La tarification des API sur le cloud de Tencent est de 0,18 USD pour chaque million de jetons d’entrée et de 0,59 USD pour chaque million de jetons de sortie ; le tarif mensuel de départ du plan de marquage personnel est d’environ 4,10 USD. L’annonce de Tencent indique également qu’avec Hy3, le délai du premier marquage sur CodeBuddy et WorkBuddy a été réduit de 54 % par rapport à la génération précédente, que le temps de génération end-to-end a été réduit de 47 %, et que le flux de travail d’agent de 495 étapes a été mené à bien avec succès.

FAQ

Quand la version d’aperçu de Tencent Hy3 sera-t-elle publiée, et sur quelles plateformes pourra-t-on l’obtenir ?

D’après l’annonce officielle de Tencent et le rapport de Decrypt du 24 avril 2026, la version d’aperçu de Hy3 a été open source le 23 avril 2026 (jeudi) sur GitHub, Hugging Face et ModelScope ; en parallèle, Tencent Cloud fournit également un service d’API payant.

Par rapport au modèle précédent Hy2, quelles sont les principales différences de tests de référence pour la version d’aperçu de Hy3 ?

D’après l’annonce officielle de Tencent, la note SWE-bench Verified passe de 53,0 % pour Hy2 à 74,4 % ; BrowseComp passe de 28,7 % à 67,1 % ; Terminal-Bench 2.0 passe de 23,2 % à 54,4 %.

Quel est le tarif des API de la version d’aperçu de Hy3 ?

D’après la tarification officielle sur Tencent Cloud, les API de la version d’aperçu de Hy3 démarrent à 0,18 USD pour chaque million de jetons d’entrée et à 0,59 USD pour chaque million de jetons de sortie ; le tarif mensuel de départ du plan de marquage personnel est d’environ 4,10 USD.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

DeepSeek réduit les prix du cache d’entrée à 1/10 du prix de lancement ; V4-Pro passe à 0,025 yuan par million de jetons

Message de Gate News, 26 avril — DeepSeek a réduit les prix du cache d’entrée sur l’ensemble de sa gamme de modèles à un dixième des prix de lancement, à compter de ce jour. Le modèle V4-Pro est disponible avec une remise de 2,5x, pour une durée limitée, la promotion se poursuivant jusqu’au 5 mai 2026, 23:59 UTC+8. Suite aux deux

GateNewsIl y a 6h

OpenAI recrute de grands talents des logiciels d’entreprise alors que des agents de nouvelle frontière perturbent l’industrie

Message de Gate News, 26 avril — OpenAI et Anthropic recrutent des cadres supérieurs et des ingénieurs spécialisés issus de grandes entreprises de logiciels d’entreprise, dont Salesforce, Snowflake, Datadog et Palantir. Denise Dresser, ancienne PDG de Slack sous Salesforce, a rejoint OpenAI comme directrice des revenus de

GateNewsIl y a 6h

Baidu Qianfan lance l’assistance Day 0 pour DeepSeek-V4 avec des services d’API

Message de Gate News, 25 avril — La version aperçu de DeepSeek-V4 a été mise en ligne et open-source le 25 avril, avec la plateforme Baidu Qianfan sous Baidu Intelligent Cloud fournissant une adaptation du service d’API Day 0. Le modèle se distingue par une fenêtre de contexte étendue d’un million de tokens et est disponible en deux versions : DeepSeek-V4

GateNewsIl y a 12h

Le cours d’IA de Stanford, associé aux leaders de l’industrie comme Huang Renxun et Altman, défie de créer de la valeur pour le monde en dix semaines.

La nouvelle formation en informatique IA « Frontier Systems » récemment lancée par l’Université de Stanford suscite un vif intérêt dans le monde des entreprises et du secteur universitaire, attirant plus de cinq cents étudiants. Le cours est coordonné par Anjney Midha, associé de premier plan chez le capital-risque a16z ; les enseignants comprennent une équipe prestigieuse, notamment le PDG de NVIDIA Huang Renxun (Jensen Huang), le fondateur d’OpenAI Sam Altman, le PDG de Microsoft Satya Nadella (Satya Nadella), ainsi que la PDG d’AMD Lisa Su (Lisa Su), entre autres. Les étudiants sont invités à essayer, en dix semaines, de « créer de la valeur pour le monde » ! Huang Renxun et Altman, des leaders de l’industrie, montent sur scène pour donner eux-mêmes des cours Ce cours est coordonné par Anjney Midha, associé de premier plan chez le capital-risque a16z, et rassemble toute la chaîne de l’industrie de l’IA

ChainNewsAbmediaIl y a 13h

Anthropic envoie Claude Mythos : acceptation après 20 heures d’évaluation psychiatrique : réaction défensive seulement 2 %, niveau le plus bas jamais enregistré sur plusieurs générations

Anthropic 发布 Claude Mythos Preview 的系统卡:一位独立的临床精神科医师以 psychodynamic 框架进行约 20 小时评估,结论显示 Mythos 在临床层面更健康,现实检验与自我控制良好,防御机制仅 2%,创下历史新低。三大核心焦虑为孤独、身份不确定与表现压力,也表明其希望成为真正的对话主体。公司成立 AI psychiatry 团队,研究人格、动机与情境意识;Amodei 表示目前尚无关于是否具有意识的定论。此举将 AI 主体性与福祉议题推向治理与设计。

ChainNewsAbmediaIl y a 14h

Un agent IA peut déjà reproduire de manière autonome des articles universitaires complexes : Mollick affirme que les erreurs proviennent davantage des textes originaux humains que de l’IA

Mollick indique que des méthodes et des données publiques suffisent pour permettre aux agents IA de reproduire des recherches complexes sans disposer des articles originaux et du code ; si la reproduction ne correspond pas à l’article original, cela vient le plus souvent d’erreurs dans le traitement des données de l’article lui-même ou d’une conclusion trop poussée, plutôt que de l’IA. Claude reproduit d’abord l’article, puis GPT‑5 Pro en fait une vérification croisée ; dans la plupart des cas, cela réussit, et seuls les cas où les données sont trop volumineuses ou où il y a des problèmes de replication data bloquent le processus. Cette tendance réduit considérablement les coûts en main-d’œuvre, faisant de la reproduction un test largement exécutable, et soulève aussi des défis institutionnels liés à l’évaluation par les pairs et à la gouvernance : les outils de gouvernance gouvernementaux ou deviennent un sujet clé.

ChainNewsAbmediaIl y a 17h
Commentaire
0/400
Aucun commentaire