GR00T N1— 英伟达开源的人形机器人基础模型
来源:互联网
时间:2025-03-20 13:25:50
nvidia发布全球首个开源通用人形机器人基础模型:gr00t n1
NVIDIA重磅推出GR00T N1,这是全球首个面向通用人形机器人的开源基础模型。它能够基于多模态输入(例如语言和图像)在各种环境中执行多种操作任务。
GR00T N1核心功能:
- 多功能操作: 执行抓取、搬运、双臂协调等多种操作任务,适应复杂环境。
- 多模态理解: 理解自然语言指令并结合视觉图像信息执行任务。
- 跨平台兼容: 兼容多种机器人平台,例如Fourier GR-1和1X Neo。
- 复杂任务规划: 能够处理需要多步骤和多种技能整合的复杂任务。
- 高效数据利用: 结合互联网数据、合成数据和真实机器人数据进行训练,提高性能和泛化能力,降低对标注数据的依赖。
GR00T N1技术架构与原理:
GR00T N1采用双系统架构:
- 视觉-语言模型 (System 2): 基于NVIDIA-Eagle和SmolLM-1.7B构建,负责环境理解、推理和规划,生成动作计划。
- 扩散变换器 (System 1): 将视觉-语言模型的计划转化为精确的连续动作,控制机器人运动。
其数据策略涵盖互联网视频数据、合成数据(NVIDIA Omniverse生成)和真实机器人数据,并利用无监督学习提升效率。模型通过大规模数据预训练和针对特定平台、任务和环境的微调来优化性能。
获取GR00T N1:
- 项目官网: https://www.php.cn/link/4a15fc6d75970e9607efa44697977f2b
- GitHub仓库: https://www.php.cn/link/4a15fc6d75970e9607efa44697977f2b
- HuggingFace模型库: https://www.php.cn/link/4a15fc6d75970e9607efa44697977f2b
- 技术论文: https://www.php.cn/link/4a15fc6d75970e9607efa44697977f2b
GR00T N1应用前景:
GR00T N1在物流、制造、零售、医疗和工业检查维护等领域具有广泛的应用前景,有望显著提升效率和自动化水平。