首页 > 教程攻略 > ai资讯 >NVIDIA面向智能汽车、机器人和视觉AI的智能体技能，开启物理AI研究新时代

NVIDIA面向智能汽车、机器人和视觉AI的智能体技能，开启物理AI研究新时代

来源：互联网时间：2026-06-09 14:07:06

由 NVIDIA Cosmos 3 驱动的全新物理 AI 智能体技能，可帮助研究人员加速面向辅助驾驶系统开发的数据生成、仿真、策略训练和评估。

在今年的 CVPR 上，NVIDIA 直接甩出了几项硬核新技能——专门为物理 AI 打造的智能体能力，目标很明确：让智能汽车、机器人和视觉 AI 系统的开发效率再上一个台阶。

先说说辅助驾驶这块。过去我们总说“数据是燃料”，但光靠车队实际跑出来的里程，数据量还是不够。NVIDIA 这次的做法是，让 AI 智能体自己学会“变戏法”——基于车队采集的真实数据，自动完成场景重建，然后生成合成场景。这里面有几个关键技术值得深挖：神经重建技能可以把车队数据直接转成可编辑的 3D 场景，这意味着仿真和合成数据生成可以更灵活、更高效。而像 Omniverse NuRec、InstantNuRec、Harmonizer 和 HiGS 这些加速渲染器，则进一步提升了重建速度、场景真实度，还能生成新视角。再搭配上开源的闭环强化学习框架 NVIDIA AlpaGym，研究人员从环境搭建、策略执行到最终评估，整个流程被打通了。最重磅的更新是，NVIDIA 还推出了一个强大的开放驾驶基础模型——NVIDIA Alpamayo 2 Super，这无疑给自动驾驶研究注入了一剂强心针。

再来看视觉 AI 系统。NVIDIA Metropolis 新增的技能，核心思路是让 AI 智能体自己“创造”训练数据——比如生成包含各种异常情况的合成视觉场景，或者对已有数据进行增强和伪标注。这些技能之所以能落地，背后靠的是 Cosmos 3 的混合 Transformer 架构。简单说，这个架构先用推理 Transformer 分析观测结果，再把指令输入给生成模块，最终输出一个符合物理规律的虚拟世界。这恰恰是突破数据瓶颈的关键所在。

机器人学习领域同样有动作。借助 NVIDIA 的机器人开发技能，研究人员可以让 AI 智能体自动完成场景准备、仿真和机器人学习这些最繁琐的开发步骤。支撑这一切的，是 Omniverse 库、Isaac Sim 和 Isaac Lab 框架。更值得一提的是，在医疗健康机器人方向，NVIDIA 推出了 Cosmos-H-Surgical-Simulator——通过生成逼真的手术机器人数据，来支持策略训练和评估。这意味着机器人可以在虚拟环境中“练手”，等到真刀真枪上阵时，已经具备了相当扎实的经验。

最后，NVIDIA 还在持续扩展物理 AI 的研究基础设施，尤其是在数据集方面下了重注。目前，NVIDIA 物理 AI 数据集在 Hugging Face 上的下载量已经突破了 1500 万次，其中 Isaac GR00T X Embodiment Sim 甚至成了下载量最高的机器人数据集之一。这次新发布的数据集包括：GRAIL，包含了大约 50 小时的人形机器人交互数据；另外还有六个合成视频数据集，分别用于机器人、物理、数字人、辅助驾驶、仓库安全以及空间推理等领域的 Cosmos 3 训练。对于研究社区来说，这些资源无疑是宝贵的“弹药”。

NVIDIA面向智能汽车、机器人和视觉AI的智能体技能，开启物理AI研究新时代

由 NVIDIA Cosmos 3 驱动的全新物理 AI 智能体技能，可帮助研究人员加速面向辅助驾驶系统开发的数据生成、仿真、策略训练和评估。

相关阅读

相关下载