Google lance Gemini Robotics ER 1.6 : modèle de robot SOTA, excellent en raisonnement visuel et spatial

Google DeepMind a publié un tout nouveau modèle de base pour robots, Gemini Robotics ER 1.6, où ER représente Embodied Reasoning (raisonnement incarné). Ce modèle atteint l’état de l’art (SOTA) actuel en matière de raisonnement visuel et spatial, et il est déjà disponible via l’API Gemini. Logan Kilpatrick, responsable des relations développeurs chez Google AI, a annoncé cette nouvelle sur les réseaux sociaux. (Source)

Qu’est-ce que le raisonnement incarné (Embodied Reasoning) ?

Le raisonnement incarné fait référence à la capacité d’un modèle IA à comprendre et à raisonner sur le monde physique. Contrairement aux modèles de langage traditionnels, les modèles de raisonnement incarné doivent traiter la position, la forme, la matière et les relations d’interaction physique des objets dans un espace tridimensionnel. Gemini Robotics ER 1.6 est spécialement optimisé pour ce type de tâches, afin que les robots puissent mieux comprendre l’environnement qui les entoure et prendre des décisions d’action appropriées.

Capacités clés

Les principaux avantages de Gemini Robotics ER 1.6 se concentrent sur deux aspects :

Capacité Description Raisonnement visuel Capable d’identifier des objets à partir d’images et de vidéos, de comprendre la structure d’une scène, et d’en tirer des décisions Raisonnement spatial Comprendre la position relative, la distance et la direction des objets dans un espace tridimensionnel, et prendre en charge une planification d’opérations complexe

La combinaison de ces deux capacités permet aux robots de gérer des tâches du monde réel plus complexes. Par exemple, dans un environnement d’entrepôt, le robot doit reconnaître simultanément des objets de formes différentes et calculer le meilleur angle de préhension ainsi que la position de pose : c’est précisément le type de scène dans lequel Gemini Robotics ER 1.6 excelle.

Utiliser via l’API Gemini

Contrairement à de nombreux modèles de robots du passé qui n’en étaient restés qu’au stade des articles de recherche, Gemini Robotics ER 1.6 offre un accès via l’API Gemini. Cela signifie que les développeurs et les fournisseurs de matériel peuvent intégrer directement ce modèle dans leurs propres systèmes de robots, sans avoir à entraîner le modèle à partir de zéro.

L’ouverture de l’API réduit également la difficulté de développer de l’IA pour robots. Dans le passé, développer un système de robot doté de capacités de raisonnement visuel et spatial nécessitait une grande quantité de collecte de données et de travail d’entraînement de modèles. Désormais, les développeurs peuvent se concentrer sur le développement de la conception matérielle et des cas d’usage, en confiant les capacités de raisonnement de base à Gemini Robotics ER 1.6.

Le déploiement de l’IA robot chez Google

Gemini Robotics ER 1.6 est la dernière réalisation de Google DeepMind dans le domaine de la robotique. Des premiers RT-2 à la série Gemini Robotics d’aujourd’hui, Google a continué d’étendre les capacités des grands modèles de langage à l’interaction avec le monde physique. La version ER 1.6 améliore encore la précision du raisonnement par rapport à ses prédécesseurs, et se distingue particulièrement dans les scénarios nécessitant des opérations fines.

À mesure que l’industrie de la robotique entre dans une nouvelle phase de croissance, les modèles de base dotés de puissantes capacités de raisonnement visuel et spatial deviendront une infrastructure clé. Pour en savoir plus sur l’évolution de l’écosystème Gemini, vous pouvez consulter le guide complet Gemini.

Cet article Google lance Gemini Robotics ER 1.6 : modèle robot SOTA, spécialisé dans le raisonnement visuel et spatial est apparu pour la première fois sur Chaîne News ABMedia.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Réalité des agents IA de la Silicon Valley : énorme gaspillage de jetons, intégration système « extrêmement chaotique », la « prochaine version de ChatGPT » selon Jensen Huang encore à confirmer

Lors de récentes conférences à la Silicon Valley, plusieurs PDG de nouvelles pousses d’IA ont donné leur avis sur les problèmes d’utilisation actuels des agents IA, estimant qu’ils font face à deux grandes difficultés : le gaspillage de jetons et un système en désordre. Des experts indiquent que les entreprises doivent déterminer plus prudemment quand utiliser des modèles de langage de grande taille, afin d’éviter un gaspillage inutile de ressources. En outre, la collaboration de plusieurs agents IA entraîne souvent des problèmes de transmission des messages et d’incohérence de l’état, ce qui montre que la standardisation actuelle doit encore être améliorée. Bien que Huang Renxun ait mentionné l’idée d’un indicateur de rémunération en fonction des jetons, les retours montrent que cela ne correspond pas à la productivité ; la valeur réelle réside dans la conception efficace des tâches.

ChainNewsAbmediaIl y a 6h

L’IA engloutit 80% du capital-risque mondial, Q1 2026 attire 242 milliards de dollars : comment les acteurs de la cryptographie doivent réagir à la réallocation des capitaux

Selon les informations, au premier trimestre 2026, le montant total mondial du capital-risque est proche de 300 milliards de dollars, dont environ 242 milliards de dollars sont attribués exclusivement aux entreprises liées à l’IA, soit 80 % du capital-risque. Cela montre que l’IA est devenue le principal centre d’intérêt du capital-risque. À mesure que les fonds se concentrent sur l’IA, d’autres domaines comme le crypto sont sous pression, et les acteurs doivent ajuster leur stratégie : intégrer l’IA plus en profondeur dans leurs activités, et s’attendre à l’émergence d’une tendance à la consolidation des infrastructures.

ChainNewsAbmediaIl y a 10h

La police de Hong Kong met en garde contre l’arnaque crypto « trading quantitatif par IA », une femme perd 7,7 millions de HK$

La police de Hong Kong a révélé une fraude en cryptomonnaies dans laquelle une femme a perdu 7,7 millions de HK$ au profit d’escrocs se faisant passer pour des experts en investissement via Telegram, promettant de hauts rendements grâce au trading avec IA. La police a mis le public en garde contre les risques liés aux investissements en cryptomonnaies.

GateNewsIl y a 12h

Hong Kong annoncera demain la sixième série de la liste des entreprises clés

Le secrétaire aux finances de Hong Kong, Paul Chan, a annoncé le lancement d’une nouvelle liste d’entreprises clés, attirant plus de 100 entreprises évaluées à plus de 100 milliards de HKD dans des secteurs tels que les sciences de la vie, l’IA et la fintech, soulignant l’attrait de Hong Kong pour les investissements internationaux.

GateNewsIl y a 15h

Le robot Lightning d’Honor remporte le semi-marathon de robots humanoïdes de Pékin 2026 avec un temps de 50:26

Le robot humanoïde « Lightning » d’Honor a établi un nouveau record lors du semi-marathon de robots humanoïdes de Yizhuang à Pékin 2026, en bouclant la course en 50 minutes et 26 secondes, dépassant le record du monde humain.

GateNewsIl y a 18h

L’action de Meta progresse de 1,73 % tandis que la société prévoit un plan de licenciement de 8 000 emplois à partir du 20 mai

Meta Platforms prévoit de supprimer environ 8 000 emplois, soit 10 % de ses effectifs, à partir du 20 mai, malgré la hausse du cours de son action. La société, qui affiche plus de $200 milliards de revenus, concentre ses investissements dans l’IA dans un contexte de restructuration importante, s’alignant sur la tendance de licenciements observée dans l’industrie.

GateNews04-18 18:01
Commentaire
0/400
Aucun commentaire