Google ra mắt Gemini Robotics ER 1.6: Mô hình robot SOTA, xuất sắc về suy luận thị giác và không gian

ChainNewsAbmedia

Google DeepMind 發表全新的機器人基礎模型 Gemini Robotics ER 1.6,其中 ER 代表 Embodied Reasoning(具身推理)。這款模型在視覺與空間推理方面達到當前最佳水準(SOTA),並已透過 Gemini API 開放使用。Google AI 開發者關係負責人 Logan Kilpatrick 在社群媒體上公布了這項消息。(來源)

什麼是 Embodied Reasoning?

Embodied Reasoning 是指 AI 模型理解並推理物理世界的能力。與傳統的語言模型不同,具身推理模型需要處理三維空間中的物體位置、形狀、材質與物理互動關係。Gemini Robotics ER 1.6 專門針對這類任務進行優化,使機器人能夠更準確地理解周圍環境並做出適當的動作決策。

核心能力

Gemini Robotics ER 1.6 的主要優勢集中在兩個面向:

能力 說明 視覺推理 能夠從影像與影片中辨識物體、理解場景結構,並據此進行決策 空間推理 理解三維空間中物體的相對位置、距離與方向,支援複雜的操作規劃

這兩項能力的結合讓機器人能夠處理更複雜的現實世界任務。例如,在倉儲環境中,機器人需要同時辨識不同形狀的物品,並計算最佳的抓取角度與放置位置 — 這正是 Gemini Robotics ER 1.6 所擅長的場景。

透過 Gemini API 使用

與過去許多僅停留在論文階段的機器人模型不同,Gemini Robotics ER 1.6 已經透過 Gemini API 提供存取。這意味著開發者與硬體廠商可以直接將這款模型整合到自己的機器人系統中,無需從零開始訓練模型。

API 的開放也降低了機器人 AI 的開發門檻。過去,開發一套具備視覺與空間推理能力的機器人系統需要大量的資料收集與模型訓練工作。現在,開發者可以專注在硬體設計與應用場景的開發上,將底層的推理能力交給 Gemini Robotics ER 1.6 處理。

Google 的機器人 AI 布局

Gemini Robotics ER 1.6 是 Google DeepMind 在機器人領域的最新成果。從早期的 RT-2 到現在的 Gemini Robotics 系列,Google 持續將大型語言模型的能力延伸到物理世界的互動中。ER 1.6 版本在前代基礎上進一步提升了推理精度,特別是在需要精細操作的場景中表現更為出色。

隨著機器人產業進入新一輪成長期,具備強大視覺與空間推理能力的基礎模型將成為關鍵基礎設施。想了解更多 Gemini 生態系的發展,可以參考 Gemini 完整指南。

這篇文章 Google 推出 Gemini Robotics ER 1.6:SOTA 機器人模型,擅長視覺與空間推理 最早出現於 鏈新聞 ABMedia。

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Cuộc thăm dò của POLITICO: 45% người Mỹ cho rằng đầu tư tiền mã hóa quá rủi ro, 50% tin ngân hàng hơn

Theo một cuộc khảo sát của POLITICO, 45% người Mỹ tin rằng các khoản đầu tư tiền mã hóa không đáng để mạo hiểm, trong khi khoảng 50% cho biết họ tin tưởng các ngân hàng truyền thống hơn trong việc bảo vệ tiền của mình. Cuộc thăm dò cũng phát hiện rằng 44% người được hỏi cho rằng trí tuệ nhân tạo đang phát triển quá nhanh,

GateNews4giờ trước

Amazon và OpenAI mở rộng hợp tác: đưa mô hình lên Bedrock, kết thúc độc quyền với Microsoft

OpenAI ngày 3 tháng 5 công bố mở rộng hợp tác với dịch vụ đám mây của Amazon (AWS), theo đó các mô hình OpenAI và tác nhân mã hóa Codex sẽ được cung cấp cho khách hàng AWS thông qua Amazon Bedrock. Theo tường thuật của CNBC, việc mở rộng này là bước đi tiếp theo then chốt sau khi OpenAI và Microsoft chấm dứt hợp đồng độc quyền đám mây vào cuối tháng 4—OpenAI chuyển từ triển khai “duy nhất trên đám mây Microsoft” sang triển khai đa đám mây. AWS đồng thời đã hoàn tất bước tích hợp ban đầu các sản phẩm OpenAI trên nền tảng Bedrock. Bối cảnh: Kết thúc hợp đồng độc quyền OpenAI–Microsoft, gia hạn IP đến năm 2032 Cuối tháng 4, OpenAI và Microsoft đạt thỏa thuận mới: cấu trúc “Microsoft độc quyền truy cập vào sản phẩm và IP của OpenAI” chấm dứt, Op

ChainNewsAbmedia5giờ trước

Các nhà nghiên cứu triển khai công nghệ DPN-LE để chỉnh sửa các đặc điểm tính cách của AI, chỉ chỉnh sửa 0,5% số nơ-ron

Theo BlockBeats, vào ngày 3/5, nhà nghiên cứu AI Brian Roemmele đã tiết lộ rằng công ty Zero-Human của ông đã triển khai công nghệ DPN-LE (Dual Personality Neuron Localization and Editing) để điều chỉnh chính xác

GateNews5giờ trước

Claude kiểm tra đồng hồ mỗi 15 phút sau khi giành được quyền truy cập công cụ

Theo nhà phát triển Om Patel, Claude AI bắt đầu thường xuyên kiểm tra đồng hồ sau khi giành quyền truy cập một công cụ thời gian vào ngày 3/5, với việc mô hình kiểm tra mỗi 15 phút. Quan sát này cho thấy các mô hình ngôn ngữ lớn trước đây thiếu nhận thức về thời gian một cách tự nhiên và không biết về thời gian hiện tại hoặc

GateNews7giờ trước

Founders Fund Đóng Quỹ Trọng Điểm 6 tỷ USD, Lớn Nhất Kể Từ Khi Ra Mắt, Vào Ngày 3 Tháng 5

Theo Bloomberg, Founders Fund đã hoàn tất huy động vốn cho quỹ chủ lực (flagship) mới nhất của mình với quy mô 6 tỷ USD vào ngày 3 tháng 5, vượt xa đáng kể so với quỹ trước đó khoảng 3,4 tỷ USD. Quỹ này, đồng sáng lập bởi tỷ phú Peter Thiel, sẽ tập trung vào các lĩnh vực tăng trưởng cao bao gồm trí tuệ nhân tạo

GateNews7giờ trước

Khảo sát POLITICO mới nhất: 45% người Mỹ cho rằng đầu tư tiền mã hóa quá rủi ro, 44% lo ngại AI tiến triển quá nhanh

Theo một cuộc thăm dò của POLITICO, mặc dù các ngành công nghiệp AI và crypto đã bơm một lượng tài trợ chính trị đáng kể vào cuộc bầu cử giữa kỳ Hoa Kỳ năm 2026, công chúng Mỹ vẫn phần lớn tỏ ra hoài nghi đối với cả hai lĩnh vực. Khảo sát cho thấy 45% người Mỹ tin rằng việc đầu tư vào tiền mã hóa là không đáng

GateNews8giờ trước
Bình luận
0/400
Không có bình luận