NVIDIA 用 NeMo Agent Toolkit 扩展机器人仿真：把物理 AI 合成数据生成推进到自动化 | 新闻中心

在物理 AI 训练中，数据质量往往决定了机器人和自主系统能否真正适应复杂真实环境。但只依赖真实世界采集，不仅成本高、速度慢，还会受到安全性和场景覆盖范围的限制。NVIDIA 这篇文章展示了一条更自动化的路径：通过 NeMo Agent Toolkit 连接多智能体工作流，把 3D 场景改造、路径规划、视频生成和真实感增强整合成可由自然语言驱动的合成数据流水线。

文章描述的核心并不是单一生成模型，而是一套协同分工的 agent 系统。用户只需要给出高层目标，例如在仓储场景中添加障碍物、重新规划机器人路径、录制导航视频，再把结果增强成真实电商仓库画面；随后，规划 agent、场景理解与修改 agent、视频录制工具以及 Cosmos 相关模型会依次接力执行，把原本需要 3D 专家、仿真工程师和数据团队共同完成的流程，收敛成更自动化的多步骤工作流。

在技术栈上，这套方案融合了 NeMo Agent Toolkit、Omniverse、OpenUSD、USD Search NIM、USD Code NIM 以及 Cosmos Transfer / Cosmos Reason 等组件。其价值在于：不仅能通过自然语言控制 OpenUSD 场景中的对象搜索、障碍物放置和路径更新，还能对生成的视频进行真实感增强，并进一步由 reasoning agent 判断输出是否适合用于训练导航策略。也就是说，它不只是“多生成点数据”，而是在尝试把数据生成、质量控制和训练适配串成闭环。

文章还强调了 headless 运行与批量化潜力。借助 Omniverse 的无界面自动化扩展，这套多智能体 SDG 流程可以在非图形界面环境中通过 API 大规模运行，适合云端部署和批处理场景。对于需要快速扩展不同仓储布局、障碍物组合、光照条件和运动路径的机器人团队来说，这意味着仿真数据生产不再局限于少量人工调参，而是可以演变为大规模、系统化的场景工厂。

从更长远的角度看，这篇文章传递出的重点，是合成数据正在从“辅助工具”升级为物理 AI 开发的核心环节。而多智能体系统的加入，则让数据生成不再只是一次性渲染流程，而变成可理解目标、可分解任务、可自动修改场景、可验证结果的智能管线。对于需要持续迭代机器人策略的团队而言，这种能力会显著影响训练效率与场景覆盖能力。

如果说生成式 AI 正在改变文本和图像生产方式，那么在机器人与物理 AI 领域，NeMo Agent Toolkit 与 Omniverse、Cosmos 的组合，则正在把合成数据生成推向更高自动化程度。它为开发者提供的不只是更快造数据的方法，而是让物理 AI 训练环境开始具备“自己构造训练世界”的能力。

NVIDIA

Extreme

Aruba

Ruckus

模块

HUAWEI

H3C

WIFI认证

深信服

网康

亿赛通

Panabit

思科

一体机

新闻中心

NVIDIA 用 NeMo Agent Toolkit 扩展机器人仿真：把物理 AI 合成数据生成推进到自动化 NEWS DETAIL

产品中心

解决方案

服务支持

联系与咨询