GR00T-Dreams:虚拟世界的数据引擎
GR00T-Dreams 基于 NVIDIA Cosmos 平台构建,能够仅凭一张图像和简单的文本提示,在虚拟环境中快速生成海量、带有精确动作标签和逼真物理交互的合成数据。这种方式使机器人可以在数小时内从零开始学习并掌握复杂任务,极大地提高了训练效率和泛化能力。
NVIDIA GR00T 项目自 2024 年推出以来,目标就是为人形机器人构建强大的通用基础模型。随着 GR00T N1.5 的推出,NVIDIA 进一步提升了该模型的推理能力和任务执行能力,尤其是在物料搬运和制造等复杂任务中。
光轮智能利用 GR00T-Dreams 进行合成数据革新
作为合成数据领域的创新者,光轮智能深度融合 GR00T-Dreams 的工作流,并将其应用于多种实际场景中:
高效仿真数据生成:光轮智能将高质量仿真环境与 GR00T-Dreams 结合,从一张图像和简单指令生成数以百万计的训练数据,结合自有高质量可泛化场景,将 GR00T-Dreams 的能力放大数百倍。
弥补真实遥操作数据的局限:借助 GR00T-Dreams,光轮智能能够生成大量虚拟数据,有效扩增和增强真实数据集,显著提升机器人在复杂多变物理环境中的适应性和执行能力。
精准高效的任务特定数据生成:GR00T-Dreams 能够根据指令精确生成针对特定任务目标的数据集(如仓储管理中的抓取、搬运、堆放),在需要高精度执行的任务中尤为关键。
新合成数据产线微调 GR00T N1.5
光轮智能建立了一条新的合成数据产线,用于对 GR00T N1.5 模型进行微调:
定制化训练数据生成:为 GR00T N1.5 提供定制化训练数据,涵盖机器人与物体、环境之间复杂的物理交互,使模型在物料搬运、抓取精度等任务中表现更加稳定高效。
高效的仿真到现实迁移:通过高质量合成数据,GR00T N1.5 在模拟环境中进行多轮训练和微调,显著缩短训练周期,在实际环境中表现更加精确。
扩展性与可持续性:合成数据产线能够根据不同任务需求快速生成大量任务特定数据集,提升了数据多样性,降低了长期维护成本。
创新应用:推动具身 AI 在现实场景中的落地
光轮智能将 GR00T-Dreams 的创新成果成功应用于多个具身 AI 领域:
智能家居与服务机器人:模拟扫地、擦桌、整理物品等复杂任务,机器人能够应对光线变化、物体位置变化等多变环境因素。
智慧农用机器人:应用于草莓采摘等农业任务,创建高度逼真的虚拟农场环境,机器人学习精细抓取动作,避免损伤果实。
自动化仓储与物流:生成大量仓库布局、货物位置和搬运任务数据,机器人在面对未知布局和突发情况时能迅速做出反应。
智能制造:助力机器人在智能生产线上的应用,在组装、搬运、物料处理等过程中稳定完成复杂工作。
加速 LeRobot 走进千家万户
光轮智能瞄准家居厨房场景,通过微调 GR00T N1.5 并部署到 Hugging Face 的LeRobot开源平台完成各项厨房任务。在实践中,光轮智能先通过少量真实采集数据以及仿真采集数据对 GR00T-Dreams 进行微调,再生成特定任务数据。通过少量专家数据与 GR00T-Dreams 生成数据约 1:10 的比例,光轮智能高效微调 GR00T N1.5 并成功实机部署到了 LeRobot 上。
共创具身 AI 的未来
通过利用 GR00T-Dreams 生成的合成数据并结合新合成数据产线的微调技术,光轮智能推动了 GR00T N1.5 在多个实际应用场景中的能力提升。这种基于合成数据的革新方法,彻底改变了传统数据依赖的瓶颈,为具身 AI 的规模化部署铺平了道路。
展望未来,NVIDIA 将持续优化 GR00T-Dreams 技术栈,并深化与光轮智能等伙伴的合作,致力于推动机器人技术从虚拟仿真向现实世界的无缝迁移。通过 GR00T 这样的基础模型和 GR00T-Dreams 这样的数据引擎,结合生态伙伴的创新应用,机器人将更好地融入人类社会,解决劳动力挑战,提升生产效率,开启物理 AI 新时代的无限可能。
WeChat
Profile