Google випустила Gemini Robotics ER 1.6: SOTA-модель для робототехніки, чудово справляється із візуальними та просторовими міркуваннями

Google DeepMind опублікувала нову базову модель для роботів Gemini Robotics ER 1.6, де ER означає Embodied Reasoning (втілене міркування). Ця модель досягла на сьогоднішній найвищого рівня у візуальному та просторовому міркуванні (SOTA) і вже доступна через Gemini API. Відповідальна за зв’язки з розробниками у Google AI Logan Kilpatrick повідомив про це у соціальних мережах. (Джерело)

Що таке Embodied Reasoning?

Embodied Reasoning — це здатність AI моделі розуміти та міркувати про фізичний світ. На відміну від традиційних мовних моделей, втілені моделі міркування мають опрацьовувати положення, форму, матеріали та фізичні співвідношення взаємодії об’єктів у тривимірному просторі. Gemini Robotics ER 1.6 спеціально оптимізована для таких завдань, щоб робот міг точніше розуміти навколишнє середовище та ухвалювати відповідні рішення щодо дій.

Ключові можливості

Основні переваги Gemini Robotics ER 1.6 зосереджені на двох напрямах:

Можливість Опис Візуальне міркування Здатність розпізнавати об’єкти з зображень і відео, розуміти структуру сцени та на їх основі ухвалювати рішення Просторове міркування Розуміння відносного положення, відстані та напрямків об’єктів у тривимірному просторі, підтримка складного планування керування

Поєднання цих двох можливостей дає роботам змогу виконувати складніші завдання у реальному світі. Наприклад, у складських умовах роботу потрібно одночасно розпізнавати різні за формою предмети та обчислювати оптимальні кути захоплення й місця розміщення — саме такі сценарії Gemini Robotics ER 1.6 вміє найкраще.

Використання через Gemini API

На відміну від багатьох робототехнічних моделей, що раніше залишалися лише на рівні наукових статей, Gemini Robotics ER 1.6 вже забезпечує доступ через Gemini API. Це означає, що розробники та виробники обладнання можуть безпосередньо інтегрувати цю модель у свої власні роботові системи, не навчаючи модель з нуля.

Відкриття API також знижує поріг розробки роботизованого AI. Раніше створення роботизованої системи з можливостями візуального та просторового міркування потребувало значного збору даних і робіт з навчання моделей. Тепер розробники можуть зосередитися на розробці апаратного дизайну та сценаріїв застосування, передаючи базові можливості міркування Gemini Robotics ER 1.6.

Розкладка Google для роботизованого AI

Gemini Robotics ER 1.6 — це найновіший результат Google DeepMind у сфері роботів. Від раннього RT-2 до нинішньої серії Gemini Robotics Google постійно розширює можливості великих мовних моделей до взаємодії з фізичним світом. Версія ER 1.6 на основі попередніх ітерацій ще більше підвищує точність міркування, зокрема у сценаріях, де потрібні точні маніпуляції.

Оскільки індустрія роботів входить у новий етап зростання, базові моделі зі потужними можливостями візуального та просторового міркування стануть ключовою базовою інфраструктурою. Щоб дізнатися більше про розвиток екосистеми Gemini, зверніться до повного гіда Gemini.

Ця стаття Google випустила Gemini Robotics ER 1.6: SOTA-модель для роботів, найкраще підходить для візуального та просторового міркування, вперше з’явилася на Сайт: ланцюг новин ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

AI поглинає 80% глобальних венчурних інвестицій; у Q1 2026 витягує 242 мільярди доларів: як учасники крипторинку мають реагувати на перерозподіл капіталу

Згідно з повідомленнями, у першому кварталі 2026 року загальний обсяг глобальних венчурних інвестицій майже досягне 300 мільярдів доларів США, з яких компанії, пов’язані з AI, самі на себе припадають приблизно на 242 млрд доларів США, що становить 80% від венчурних інвестицій. Це демонструє, що AI уже став головним фокусом венчурного ринку. Оскільки кошти концентруються в AI, інші напрями, такі як crypto, зазнають витіснення; учасникам ринку потрібно скоригувати стратегії, інтегруючи AI в бізнес ще глибше, і очікувати тенденції до консолідації інфраструктури.

ChainNewsAbmedia2год тому

Поліція Гонконгу застерігає про криптосхему зі «сAI кількісним трейдингом»: жінка втратила HK$7,7 млн

Поліція Гонконгу розкрила аферу з криптовалютою, під час якої жінка втратила 7,7 мільйона HK$ шахраям, що видавали себе за інвестиційних експертів через Telegram, обіцяючи високі прибутки завдяки AI-трейдингу. Поліція застерегла громадськість про ризики, пов’язані з інвестиціями в криптовалюти.

GateNews4год тому

Гонконг оголосить сьомий список ключових підприємств завтра

Фінансовий секретар Гонконгу Пол Чан оголосив про представлення нового списку ключових підприємств, привернувши понад 100 компаній із вартістю понад 100 млрд гонконгських доларів у таких секторах, як науки про життя, ШІ та фінтех, підкресливши привабливість Гонконгу для міжнародних інвестицій.

GateNews7год тому

Робот Lightning від Honor перемагає на напівмарафоні гуманоїдних роботів у Пекіні 2026 з фінішем 50:26

Гуманоїдний робот Honor "Lightning" встановив новий рекорд на напівмарафоні гуманоїдних роботів у Пекіні Yizhuang 2026, завершивши перегони за 50 хвилин 26 секунд, перевершивши світовий рекорд людини.

GateNews10год тому

Акції Meta зростають на 1,73%, поки компанія планує звільнення 8,000 працівників, що стартують 20 травня

Meta Platforms планує скоротити приблизно 8,000 робочих місць, або 10% свого штату, починаючи з 20 травня, попри зростання цін на акції. Компанія, яка має понад $200 мільярдів доходу, зосереджується на інвестиціях в ІІ на тлі суттєвої реструктуризації, узгоджуючись із галузевими тенденціями звільнень.

GateNews18год тому

Звіт Google за рік стверджує, що Gemini досягає перехоплення за мілісекунди, блокуючи 99% шахрайських оголошень

Стаття обговорює, як Google за допомогою своєї генеративної системи штучного інтелекту Gemini посилює безпеку реклами; звіт показує, що швидкість виявлення та блокування порушуваних оголошень скоротилася до мілісекунд, а рівень блокування досяг 99%. Минулого року Google видалив 8,3 млрд рекламних оголошень і призупинив 24,9 млн акаунтів, що демонструє суттєве зростання кількості шахрайських оголошень. Експерти зазначають, що це протистояння між штучним інтелектом і штучним інтелектом; у майбутньому все одно доведеться мати справу з викликами, які приносить AI, зокрема щодо законних і незаконних дій.

ChainNewsAbmedia19год тому
Прокоментувати
0/400
Немає коментарів