Google 推出 Gemini Robotics ER 1.6:SOTA 機器人模型,擅長視覺與空間推理

鏈新聞abmedia

Google DeepMind 發表全新的機器人基礎模型 Gemini Robotics ER 1.6,其中 ER 代表 Embodied Reasoning(具身推理)。這款模型在視覺與空間推理方面達到當前最佳水準(SOTA),並已透過 Gemini API 開放使用。Google AI 開發者關係負責人 Logan Kilpatrick 在社群媒體上公布了這項消息。(來源)

什麼是 Embodied Reasoning?

Embodied Reasoning 是指 AI 模型理解並推理物理世界的能力。與傳統的語言模型不同,具身推理模型需要處理三維空間中的物體位置、形狀、材質與物理互動關係。Gemini Robotics ER 1.6 專門針對這類任務進行優化,使機器人能夠更準確地理解周圍環境並做出適當的動作決策。

核心能力

Gemini Robotics ER 1.6 的主要優勢集中在兩個面向:

能力 說明 視覺推理 能夠從影像與影片中辨識物體、理解場景結構,並據此進行決策 空間推理 理解三維空間中物體的相對位置、距離與方向,支援複雜的操作規劃

這兩項能力的結合讓機器人能夠處理更複雜的現實世界任務。例如,在倉儲環境中,機器人需要同時辨識不同形狀的物品,並計算最佳的抓取角度與放置位置 — 這正是 Gemini Robotics ER 1.6 所擅長的場景。

透過 Gemini API 使用

與過去許多僅停留在論文階段的機器人模型不同,Gemini Robotics ER 1.6 已經透過 Gemini API 提供存取。這意味著開發者與硬體廠商可以直接將這款模型整合到自己的機器人系統中,無需從零開始訓練模型。

API 的開放也降低了機器人 AI 的開發門檻。過去,開發一套具備視覺與空間推理能力的機器人系統需要大量的資料收集與模型訓練工作。現在,開發者可以專注在硬體設計與應用場景的開發上,將底層的推理能力交給 Gemini Robotics ER 1.6 處理。

Google 的機器人 AI 布局

Gemini Robotics ER 1.6 是 Google DeepMind 在機器人領域的最新成果。從早期的 RT-2 到現在的 Gemini Robotics 系列,Google 持續將大型語言模型的能力延伸到物理世界的互動中。ER 1.6 版本在前代基礎上進一步提升了推理精度,特別是在需要精細操作的場景中表現更為出色。

隨著機器人產業進入新一輪成長期,具備強大視覺與空間推理能力的基礎模型將成為關鍵基礎設施。想了解更多 Gemini 生態系的發展,可以參考 Gemini 完整指南。

這篇文章 Google 推出 Gemini Robotics ER 1.6:SOTA 機器人模型,擅長視覺與空間推理 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

印度警告網路資安風險,因 Anthropic 的 Mythos AI 在 100 個測試案例中的 83 個中突破防禦

根據《The Economic Times》,印度的資安機構最近在 Anthropic 的 Mythos AI 展示出能夠在幾分鐘內找到數萬個漏洞,並將軟體程式錯誤轉換為可被利用的攻擊之後,發布了高嚴重性警示。 Palo Alto Networks 的 Unit 42 與

GateNews9分鐘前

投資人手中 1 股變 480 股,輝達下一波股票拆分前的進場機會是現在嗎?

本文回顧輝達自1999年上市以來多次股票分割,讓早期持股透過分割增至480股,並在2024年以10拆1調整股價至約120美元。受全球AI基礎設施需求帶動,輝達成為資料中心核心供應商,市值逼近5兆美元,成長動能依然強勁。分析師預測下一次分割將取決於股價與成長表現;目前股價約198美元,若持續成長,或出現新的入場契機,但僅為市場觀察、非投資建議。

鏈新聞abmedia16分鐘前

Google、VNG 於 5 月 4 日在越南推出應用 AI 實驗室

根據 VNG Corporation、Google、VNG 以及越南國立大學胡志明市的消息,Google、VNG 與越南國立大學胡志明市於 5 月 4 日透過 Saigon AI Hub 在越南推出應用型 AI 實驗室。Google Labs 和 AI Future Funds 將為入選團隊提供 Google 技術的提前存取,並提供來自 Google 的技術支援,和

GateNews19分鐘前

Anthropic Partners、貝萊德(BlackRock)和高盛(Goldman Sachs)將以 15 億美元投資成立 AI 顧問合資企業(JV)

根據 WSJ,Anthropic 正在敲定一項交易,計劃在週一與 BlackRock、Goldman Sachs 以及其他華爾街公司成立合資企業,目標是向獲私募股權支持的公司銷售人工智慧工具。該合資企業預期將作為 Anthropic 的顧問部門,

GateNews1小時前

中國攔截 Meta 的 US$2B Manus AI 收購案

中國宣布正在阻止 Meta 以 20 億美元收購 AI 代理公司 Manus,理由是擔心將中國的人工智慧智慧財產權轉移給美國公司;根據 Tech in Asia 的報導。 Manus 是一家由中國創立的公司,並將其總部遷至

Crypto Frontier1小時前

騰訊在最新 Hy3 模型訓練中使用了 Anthropic 的 Claude Code,《The Information》報導

根據《The Information》,援引內部騰訊備忘錄與消息來源,儘管 Anthropic 明確禁止向以「國家」為由的中國企業提供商業服務,騰訊員工仍在其最新大型語言模型 Hy3 的後訓練階段使用了 Anthropic 的 Claude Code。

GateNews1小時前
留言
0/400
暫無留言