NVIDIA 于 GTC 大会宣布推出 Physical AI Data Factory Blueprint(实体人工智能数据工厂蓝图),这是一套开放式的参考架构,旨在自动化数据生成、增强评估流程;通过模块化工作流程,协助开发者将原始数据转化为高品质训练集,从而降低大规模开发机器人、视觉人工智能代理及自动驾驶车的成本与技术门槛。
实体人工智能数据工厂蓝图是什么?
Physical AI 高度依赖资料量与模型容量的同步成长,“实体人工智能数据工厂蓝图”提供了一套通用标准,将原本碎片化的数据处理程序整合为专用自动化管道,通过 Cosmos Curator 进行大规模现实世界与合成资料的处理、提炼与标注,然后利用 Cosmos Transfer 技术,将精选后的数据进行指数级的扩张与多样化处理,模拟不同环境、光照条件及现实中难以捕捉的罕见边缘案例。最后由 Cosmos Reason 驱动的评估器自动对生成的数据进行评分与验证,确保资料符合物理准确性并达到训练标准,解决了过去人工筛选资料效率低下的问题。
为了支援大规模的运算需求,NVIDIA 与微软 Azure 及 Nebius 等云端服务供应商合作,将此蓝图整合至现有的云端基础设施中。微软 Azure 将此架构纳入其 GitHub 上的开放实体人工智能工具链,结合 IoT 操作与即时智慧服务,提供企业级的代理驱动工作流程。Nebius 在其人工智能云端平台整合了 OSMO 编排框架,支援 RTX PRO 6000 Blackwell 服务器版 GPU,为开发者提供从数据管理、标注到无服务器执行、托管推理的端到端堆叠。这种架构让开发者能将加速运算能力直接转化为海量训练数据,加速自主系统的建构。
NVIDIA OSMO 开源编排框架管理软件编排、编码代理
针对缺乏大规模人工智能基础设施管理能力的开发团队,实体 AI 数据工厂蓝图引入了 NVIDIA OSMO 开源编排框架。OSMO 的核心功能在于跨运算环境、管理复杂的工作流程,减少手动任务的干预,使技术团队能更专注于模型本身的优化。目前 OSMO 已与 Claude、OpenAI Codex 及 Cursor 等编码代理整合,实现人工智能原生操作。在这种模式下,代理程序能主动管理运算资源、识别并排除系统瓶颈,从而缩短模型从开发到交付的周期。
目前多间实体人工智能开发商已开始导入实体人工智能数据工厂蓝图,应用范围涵盖多元领域。Skild AI 运用此架构推动通用机器人基础模型的开发;Uber 则将其用于自动驾驶车的研发与验证。此外,FieldAI、Hexagon Robotics、BMW、Linker Vision、Milestone Systems 与 Teradyne Robotics 等企业也正透过该蓝图强化其在感知、移动与强化学习管道中的资料生产能力。
这篇文章 GTC 2026:辉达发表实体 AI 数据工厂蓝图,加速开发机器人及自驾车 最早出现在 链新闻 ABMedia。