Tencent publie la série de modèles d’intelligence incarnée HY-Embodied-0.5, la version 2B est open source

Nouvelles de Gate, le 10 avril : Tencent Hunyuan publie la série de modèles de base d’intelligence artificielle incarnée HY-Embodied-0.5, dont la version à 2B paramètres a été officiellement ouverte en open source. Cette série de modèles est conçue pour des agents d’intelligence incarnée dans le monde réel, et met l’accent sur l’amélioration de la perception spatio-temporelle et des capacités de raisonnement incarné, pouvant s’appliquer à des scénarios tels que la prédiction de l’environnement, l’exécution d’interactions et la planification de tâches.

Cette famille de modèles comprend deux versions : 2B et 32B. Le modèle 2B s’adresse aux appareils en périphérie et à des déploiements légers, tandis que le modèle 32B est utilisé pour des tâches de raisonnement complexes et des décisions intelligentes de niveau supérieur. Sur le plan de l’architecture technique, HY-Embodied-0.5 introduit le mécanisme Mixture-of-Transformers (MoT) afin de réaliser un calcul réparti par spécialisation multimodale, améliore les capacités de représentation de la perception via des tokens latents, et combine un entraînement post auto-évolution et des méthodes de distillation basées sur la stratégie, afin de parvenir à une optimisation coordonnée des capacités des modèles de petite et de grande taille.

En termes de performances, cette série de modèles se distingue lors de 22 tests de référence : le modèle 2B dépasse, sur 16 tâches, les modèles SOTA de même échelle ; la version 32B est déjà proche du niveau de pointe, démontrant une forte capacité de généralisation de l’intelligence incarnée ainsi qu’un potentiel d’application réel.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Le rallye boursier en Corée du Sud surpasse les marchés mondiaux avec l’essor de l’IA

Le marché boursier sud-coréen enregistre des gains sans précédent, portés par les valeurs des semi-conducteurs liées à l’intelligence artificielle, l’indice KOSPI étant en hausse de 78% depuis le début de l’année, devançant tous les autres grands marchés dans le monde, d’après des données de Financial Modeling Prep citées dans une analyse d’Axios. AI

CryptoFrontierIl y a 8m

DeepL réduit de 25 % ses effectifs (environ 250 employés) pour restructurer son activité liée à l’IA

D’après Bloomberg, la société de traduction DeepL a annoncé aujourd’hui, le 7 mai, qu’elle allait licencier environ 25 % de ses effectifs, soit quelque 250 employés, afin de s’adapter à des changements structurels portés par l’intelligence artificielle. Le PDG Jarek Kutylowski a déclaré sur LinkedIn que l’entreprise réduira le management

GateNewsIl y a 38m

NVIDIA lance Nemotron 3 Nano Omni open source, un modèle multimodal

NVIDIA a annoncé Nemotron 3 Nano Omni, un modèle multimodal open source, qui intègre la vision, la parole et le langage au sein d’un seul modèle, comme couche de perception pour les agents IA. Le cœur est constitué d’un MoE 30B-A3B, d’un contexte de 256K et d’un débit de 9x ; il prend en charge des entrées texte, image, audio, vidéo, etc., et génère une sortie sous forme de texte. En synergie avec Nemotron 3 Super/Ultra, il vise des cas d’usage comme l’exploitation de l’ordinateur, l’intelligence documentaire et la compréhension audio-vidéo, tout en publiant les poids et les données d’entraînement, avec un déploiement couvrant le local, NIM et des plateformes tierces.

ChainNewsAbmediaIl y a 1h

Cursor révèle une méthode de formation à l'installation automatique et améliore les performances de Composer 2 de 14 points de pourcentage

D’après la divulgation récente de Cursor, la société a dévoilé une technique d’entraînement appelée autoinstall pour sa série de modèles Composer : utiliser un modèle de génération précédente pour configurer automatiquement des environnements exécutables pour le prochain génération de l’apprentissage par renforcement. Lors de l’entraînement de Composer 2, Cursor

GateNewsIl y a 1h

OpenAI DevDay 2026 aura lieu le 29/09 à San Francisco

OpenAI annonce que DevDay 2026 se tiendra en présentiel le 29/09 à San Francisco, avec un concours de créations utilisant GPT-5.5 et Image Gen. Codex sélectionnera automatiquement 2–3 projets chaque semaine ; les gagnants recevront des billets gratuits ainsi que des vols et des hôtels pour traverser les villes. L’événement se concentrera sur l’écosystème GPT-5.5 et sur l’évaluation de la collaboration homme-machine ; pour participer, il faut avoir au moins 18 ans et ne pas être un membre de la famille directe employé d’OpenAI. Les axes d’observation incluent le nouveau modèle, l’intégration d’agents et les stratégies multi-cloud.

ChainNewsAbmediaIl y a 1h
Commentaire
0/400
Aucun commentaire