Niantic 以 300 亿张 Pokémon Go 城市影像打造视觉定位系统,精准度达厘米级,并导入 1,000 台配送机器人测试。
风靡全球的增强现实游戏《宝可梦 Go(Pokémon Go)》游戏开发商 Niantic 旗下 AI 公司 Niantic Spatial,正利用玩家多年拍摄的数十亿张城市影像,建立一套能理解真实世界的「视觉定位系统」与 AI 世界模型。该技术可在 GPS 信号不稳定的城市环境中精准定位,并已与配送机器人公司合作测试,为未来机器人与 AI 在现实世界中的导航能力开启新方向。
《Pokémon Go》自 2016 年推出后迅速成为全球热门游戏,玩家通过手机镜头在现实世界中捕捉宝可梦。这款由 Niantic 开发的知名增强现实(AR)游戏即使推出多年,至今每年仍维持超过 1 亿名活跃玩家。
然而,玩家在游戏过程中需不断将手机镜头对准城市建筑与地标,这无意中为该公司累积了大量影像资料。
Niantic 旗下人工智能公司 Niantic Spatial 近日表示,公司已收集并整理约 300 亿张来自全球城市环境的照片,这些影像都带有精确的地理位置与拍摄信息,例如手机方向、移动速度与拍摄角度。这些资料如今正被用来训练 AI,以建立能理解现实空间的「世界模型(World Model)」。
NewsForce 报导,Niantic Spatial 最新开发的技术是一套视觉定位系统(Visual Positioning System, VPS)。这套 AI 模型能通过分析建筑或地标的照片,判断使用者所在的位置,精准度甚至可达厘米级。
公司表示,目前数据库已涵盖全球超过 100 万个地标位置。在每一个地点,都可能累积数千张不同时间、不同角度与不同天气条件下拍摄的影像。AI 通过比对这些影像特征,可以推算出装置所在的位置与观看方向,推估出相对精准的定位结果。
Niantic Spatial 技术长 Brian McClendon 指出,这与传统 GPS 定位不同,GPS 依赖卫星信号,而 VPS 则是通过「看见什么」来判断位置:
在高楼密集的都市环境中,GPS 信号经常出现偏差,可能导致定位误差达数十米、甚至是方向错误。
这种误差对一般用户影响不大,但对需要精准导航的机器人来说,却可能造成重大问题。因此,结合影像识别的定位技术,也正是机器人公司关注的解决方案。
Niantic Spatial 目前已与配送机器人公司 Coco Robotics 展开合作测试。Coco 在美国与欧洲多个城市部署约 1,000 台配送机器人,主要用于餐饮与杂货的配送服务。这些机器人体型约如小型行李箱,可携带最多 8 个大型披萨或 4 袋杂货。
该公司表示,目前机器人虽已完成超过 50 万趟配送,但有时仍会因 GPS 定位失准,导致机器人难以准确停在餐厅门口或客户门前:
通过 Niantic 的视觉定位模型,机器人可利用自身搭载的四个摄像机分析周围环境,以更精准地判断位置与行进方向,提升配送可靠度。
Niantic Spatial 执行长 John Hanke 指出,最初开发视觉定位技术的目的是支持 AR 眼镜与增强现实应用,但随着机器人产业快速发展,公司开始将技术转向机器人导航。
他表示,公司正在建立一套称为「活地图(Living Map)」的系统,这是一种高度细致且持续更新的数字世界模型,能随着现实世界的变化不断更新。
未来,配送机器人、智能设备甚至 AR 装置都可能成为地图资料来源,持续回传环境信息,使数字世界逐渐接近真实世界的动态样貌。
近年来 AI 研究领域开始重视「世界模型(World Model)」概念。尽管大型语言模型(LLM)在文字与知识处理方面表现出色,但在理解物理空间与现实环境方面仍存在明显限制。
通过结合地图、影像与环境信息,世界模型试图让 AI 能够理解物体、空间关系与环境变化。包括 Google DeepMind 等公司,也在开发能生成虚拟世界的模型,用于训练 AI 代理。
Niantic Spatial 则采取不同策略,通过大量真实世界影像资料,逐步重建现实世界的数字模型。随着资料持续累积,该系统可能成为未来机器人与 AI 理解现实世界的重要基础设施。