Google випустила Gemini Robotics ER 1.6: SOTA-модель для робототехніки, чудово справляється із візуальними та просторовими міркуваннями

2026-04-14 18:06:15

Google DeepMind опублікувала нову базову модель для роботів Gemini Robotics ER 1.6, де ER означає Embodied Reasoning (втілене міркування). Ця модель досягла на сьогоднішній найвищого рівня у візуальному та просторовому міркуванні (SOTA) і вже доступна через Gemini API. Відповідальна за зв’язки з розробниками у Google AI Logan Kilpatrick повідомив про це у соціальних мережах. (Джерело)

Що таке Embodied Reasoning?

Embodied Reasoning — це здатність AI моделі розуміти та міркувати про фізичний світ. На відміну від традиційних мовних моделей, втілені моделі міркування мають опрацьовувати положення, форму, матеріали та фізичні співвідношення взаємодії об’єктів у тривимірному просторі. Gemini Robotics ER 1.6 спеціально оптимізована для таких завдань, щоб робот міг точніше розуміти навколишнє середовище та ухвалювати відповідні рішення щодо дій.

Ключові можливості

Основні переваги Gemini Robotics ER 1.6 зосереджені на двох напрямах:

Можливість Опис Візуальне міркування Здатність розпізнавати об’єкти з зображень і відео, розуміти структуру сцени та на їх основі ухвалювати рішення Просторове міркування Розуміння відносного положення, відстані та напрямків об’єктів у тривимірному просторі, підтримка складного планування керування

Поєднання цих двох можливостей дає роботам змогу виконувати складніші завдання у реальному світі. Наприклад, у складських умовах роботу потрібно одночасно розпізнавати різні за формою предмети та обчислювати оптимальні кути захоплення й місця розміщення — саме такі сценарії Gemini Robotics ER 1.6 вміє найкраще.

Використання через Gemini API

На відміну від багатьох робототехнічних моделей, що раніше залишалися лише на рівні наукових статей, Gemini Robotics ER 1.6 вже забезпечує доступ через Gemini API. Це означає, що розробники та виробники обладнання можуть безпосередньо інтегрувати цю модель у свої власні роботові системи, не навчаючи модель з нуля.

Відкриття API також знижує поріг розробки роботизованого AI. Раніше створення роботизованої системи з можливостями візуального та просторового міркування потребувало значного збору даних і робіт з навчання моделей. Тепер розробники можуть зосередитися на розробці апаратного дизайну та сценаріїв застосування, передаючи базові можливості міркування Gemini Robotics ER 1.6.

Розкладка Google для роботизованого AI

Gemini Robotics ER 1.6 — це найновіший результат Google DeepMind у сфері роботів. Від раннього RT-2 до нинішньої серії Gemini Robotics Google постійно розширює можливості великих мовних моделей до взаємодії з фізичним світом. Версія ER 1.6 на основі попередніх ітерацій ще більше підвищує точність міркування, зокрема у сценаріях, де потрібні точні маніпуляції.

Оскільки індустрія роботів входить у новий етап зростання, базові моделі зі потужними можливостями візуального та просторового міркування стануть ключовою базовою інфраструктурою. Щоб дізнатися більше про розвиток екосистеми Gemini, зверніться до повного гіда Gemini.

Ця стаття Google випустила Gemini Robotics ER 1.6: SOTA-модель для роботів, найкраще підходить для візуального та просторового міркування, вперше з’явилася на Сайт: ланцюг новин ABMedia.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов'язані статті

Рекурсивний суперінтелект завершив залучення 500 мільйонів доларів США, Nvidia очолила раунд

Market Whisper04-20 06:38

Франція викликала Маска 20 квітня до Парижа для допиту за запитом на платформі X

Market Whisper04-20 03:00

Віталік підтвердив участь у виступі в Гонконзі; ключовими фокусами стануть AI-екосистема Ethereum і застосування ZK

Market Whisper04-20 01:42

Звіт Google за рік стверджує, що Gemini досягає перехоплення за мілісекунди, блокуючи 99% шахрайських оголошень

ChainNewsAbmedia04-18 16:15

NVIDIA представила першу у світі «Ізингову модель», створену для квантового ШІ

ChainNewsAbmedia04-17 15:55

Прокоментувати

0/400

Немає коментарів