Google випустила Gemini Robotics ER 1.6: SOTA-модель для робототехніки, чудово справляється із візуальними та просторовими міркуваннями

Google DeepMind опублікувала нову базову модель для роботів Gemini Robotics ER 1.6, де ER означає Embodied Reasoning (втілене міркування). Ця модель досягла на сьогоднішній найвищого рівня у візуальному та просторовому міркуванні (SOTA) і вже доступна через Gemini API. Відповідальна за зв’язки з розробниками у Google AI Logan Kilpatrick повідомив про це у соціальних мережах. (Джерело)

Що таке Embodied Reasoning?

Embodied Reasoning — це здатність AI моделі розуміти та міркувати про фізичний світ. На відміну від традиційних мовних моделей, втілені моделі міркування мають опрацьовувати положення, форму, матеріали та фізичні співвідношення взаємодії об’єктів у тривимірному просторі. Gemini Robotics ER 1.6 спеціально оптимізована для таких завдань, щоб робот міг точніше розуміти навколишнє середовище та ухвалювати відповідні рішення щодо дій.

Ключові можливості

Основні переваги Gemini Robotics ER 1.6 зосереджені на двох напрямах:

Можливість Опис Візуальне міркування Здатність розпізнавати об’єкти з зображень і відео, розуміти структуру сцени та на їх основі ухвалювати рішення Просторове міркування Розуміння відносного положення, відстані та напрямків об’єктів у тривимірному просторі, підтримка складного планування керування

Поєднання цих двох можливостей дає роботам змогу виконувати складніші завдання у реальному світі. Наприклад, у складських умовах роботу потрібно одночасно розпізнавати різні за формою предмети та обчислювати оптимальні кути захоплення й місця розміщення — саме такі сценарії Gemini Robotics ER 1.6 вміє найкраще.

Використання через Gemini API

На відміну від багатьох робототехнічних моделей, що раніше залишалися лише на рівні наукових статей, Gemini Robotics ER 1.6 вже забезпечує доступ через Gemini API. Це означає, що розробники та виробники обладнання можуть безпосередньо інтегрувати цю модель у свої власні роботові системи, не навчаючи модель з нуля.

Відкриття API також знижує поріг розробки роботизованого AI. Раніше створення роботизованої системи з можливостями візуального та просторового міркування потребувало значного збору даних і робіт з навчання моделей. Тепер розробники можуть зосередитися на розробці апаратного дизайну та сценаріїв застосування, передаючи базові можливості міркування Gemini Robotics ER 1.6.

Розкладка Google для роботизованого AI

Gemini Robotics ER 1.6 — це найновіший результат Google DeepMind у сфері роботів. Від раннього RT-2 до нинішньої серії Gemini Robotics Google постійно розширює можливості великих мовних моделей до взаємодії з фізичним світом. Версія ER 1.6 на основі попередніх ітерацій ще більше підвищує точність міркування, зокрема у сценаріях, де потрібні точні маніпуляції.

Оскільки індустрія роботів входить у новий етап зростання, базові моделі зі потужними можливостями візуального та просторового міркування стануть ключовою базовою інфраструктурою. Щоб дізнатися більше про розвиток екосистеми Gemini, зверніться до повного гіда Gemini.

Ця стаття Google випустила Gemini Robotics ER 1.6: SOTA-модель для роботів, найкраще підходить для візуального та просторового міркування, вперше з’явилася на Сайт: ланцюг новин ABMedia.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Megazone Cloud співпрацює з AWS для програми навчання з AI в Південній Кореї

Megazone Cloud, компанію хмарних сервісів із Південної Кореї, 4 травня Amazon Web Services обрала партнером з операційної підтримки для AWS Agentic AI GameDay у Південній Кореї, повідомила компанія. Програма є практичним навчальним заходом під керівництвом Центру інновацій генеративного ШІ AWS,

CryptoFrontier5хв. тому

Засновник Solana попереджає, що ШІ може зламати постквантову криптографію до «breakpoint» у 2026 році

За словами співзасновника Solana Анатолія Яковенка, який виступив на конференції 2026 Solana Breakpoint в Амстердамі, штучний інтелект створює більшу екзистенційну загрозу безпеці блокчейнів, ніж квантові комп’ютери. Яковенко попередив, що моделі ШІ можуть використовувати приховані математичні закономірності в po

GateNews25хв. тому

Від туалетів до виробників приправ: як екосистема цінності в ланцюгах постачання завдяки AI «розливається» та підсилює які компанії?

Хвиля «бенефіту» від штучного інтелекту продовжує поширюватися: від Nvidia до таких технологічних гігантів, як TSMC. Нині японська компанія, що виробляє унітази, і харчовий холдинг, який колись починав із глутамату натрію, непомітно стали «прихованими переможцями» цього спекотного тренду на AI-інфраструктуру. Їхній підйом виявив ключову тенденцію: ефект перетікання цінності в ланцюгах постачання AI давно вкорінився у традиційне виробництво та відкриває все більш різноманітні можливості для трансформації. Виробник унітазів TOTO: керамічна технологія несподівано потрапила в запит на кремнієву (晶圓) процесну лінію Японська компанія TOTO, один із провідних виробників сантехніки, відома в усьому світі завдяки високоякісним кришкам для унітазів і понад 40 років працює в керамічному виробництві. Однак саме ця, на перший погляд, така далека від технологій традиційна майстерність дала їй нову сцену в напівпровідникових виробничих процесах. TOTO нещодавно оголосила, що використовуватиме власну експертизу в керамічних технологіях для виробництва електростатичних затискачів (Electrostatic Chuck), які застосовують у виробництві чипів. Після появи новини акції різко…

ChainNewsAbmedia2год тому

MediaTek наймає колишнього керівника TSMC для розширення напрямку AI-чипів

Тайванський чипдизайнер MediaTek призначив колишнього керівника Taiwan Semiconductor Manufacturing Co (TSMC) Дугласа Ю позаштатним радником 4 травня, повідомляє Reuters. Цей крок підтримує розширення MediaTek у сегмент чипів для ШІ та просування її технологій пакування. Advanced

CryptoFrontier2год тому

OpenAI співпрацює з Yubico, щоб запропонувати кастомні апаратні безпекові ключі

За даними Yubico, OpenAI співпрацювала зі шведською компанією зі Стокгольма — виробником ключів безпеки — щоб запропонувати кастомні YubiKeys у межах своєї програми Advanced Account Security. Програма націлена на користувачів із підвищеним ризиком фішингових атак і захоплення акаунтів. У комплект входить YubiKey C NFC для мобільних пристроїв і Y

GateNews2год тому

Індія попереджає про кіберризики через те, що ШІ Anthropic Mythos ізламує захисти у 83 із 100 тестових кейсів

Згідно з The Economic Times, індійське агентство з кібербезпеки нещодавно видало попередження високої критичності після того, як ШІ Anthropic Mythos продемонстрував здатність знаходити десятки тисяч вразливостей і перетворювати баги програмного забезпечення на експлуатовані атаки за кілька хвилин. Підрозділ Unit 42 компанії Palo Alto Networks і

GateNews4год тому
Прокоментувати
0/400
Немає коментарів