首页 > 教程攻略 > ai资讯 >Xiaomi Auto WorldModel:小米推出的自动驾驶仿真与数据生成AI模型

Xiaomi Auto WorldModel:小米推出的自动驾驶仿真与数据生成AI模型

来源:互联网 时间:2026-05-30 09:42:24

一、Xiaomi Auto WorldModel是什么?

简单来说,

Xiaomi Auto WorldModel(小米汽车自动驾驶联合世界模型)

是小米在自动驾驶领域打出的“王炸”——一个将3D场景重建与视频生成深度捆绑的一体化框架。它由 WorldRec(场景重建)、WorldGen(视频生成)和 Joint World Model(联合模型)三大模块协同工作,专门解决传统自动驾驶方案中那些让人头疼的“老毛病”:重建效率低、生成视频容易“鬼影漂移”、几何结构与视觉效果总是“两张皮”。

它和市面上那些“先独立建个3D场景,再单独生成视频”的松散组合模式截然不同。Xiaomi Auto WorldModel 的核心思路,是把

几何表征和视觉生成牢牢“绑”在一起

。这意味着,它既能确保3D场景的真实几何精度,又能高效生成长时间、多视角、路况复杂的行车视频。说白了,这是一套专为自动驾驶仿真训练、数据补充和端到端模型训练打造的全链路技术方案。目前,它在主流自动驾驶公开数据集上的表现,已经稳居行业第一梯队。

四、应用场景

既然有了“重建+生成”这套硬核能力,那么它具体能在哪些地方派上用场?答案几乎是覆盖了自动驾驶研发的全流程,从企业研发到算法训练,再到场景测试,处处都有它的身影。几个核心场景如下:

  1. 自动驾驶闭环仿真测试。

    搭建一套虚拟的行车环境,把城市道路、高速、复杂路口、恶劣天气等各种场景都模拟出来,替代一部分实车路测。这样做的好处显而易见——成本降低、安全性提升。更关键的是,它能长时间连续运行仿真任务,稳定重现车辆行驶、障碍物移动、路况变化这些动态过程。

  2. 自动驾驶合成数据制作。

    深度学习算法依赖海量的标注数据,但真实数据采集成本高,稀有的“长尾场景”样本更是难找。模型可以批量生成合规、高真实度的虚拟行车图像和视频,轻松补充雨天、夜间、突发路况这些稀缺样本,让训练数据集更具代表性。

  3. 端到端自动驾驶模型训练。

    为感知、决策、控制算法提供标准化的虚拟训练数据和仿真环境。研发人员可以直接基于这个框架快速迭代算法、验证效果,大幅缩短自动驾驶算法的研发周期。

  4. 场景复现与问题复盘。

    实车路测时遇到的特殊工况或故障,可以通过3D重建还原现场环境,再利用视频生成完整复现行车过程。技术人员可以针对性地定位问题、优化算法。

五、使用方法

好消息是,这套工具的上手流程并不复杂。项目通过开源网页和模型仓库发布,整体部署和使用可以分为三步,对研发同学和算法工程师都非常友好:

  1. 环境访问与前置准备。

    想快速体验?直接访问官方演示地址(https://jointwm.github.io/),在线就能玩转基础的重建和视频生成功能,根本不需要本地部署。如果要在本地跑,只需要配置好主流深度学习环境(比如PyTorch、OpenCV、3D Gaussian Splatting 这些依赖库),推荐用GPU来跑,速度会更爽。

  2. 基础功能在线使用。

    进入官方网页后,上传车载多视角视频或图像序列就行(主流格式都支持)。然后选择你想要的功能模式:「仅3D重建」「仅视频生成」「联合重建+生成」三种可选。点一下执行按钮,等上几秒,就能拿到3D场景文件和连续生成的视频,支持在线预览和下载。

  3. 二次开发与模型调用。

    开发者可以直接拉取项目源码,基于现有模块接口进行自定义开发,比如调整场景参数、生成视角、视频时长。它还支持对接自研的自动驾驶算法,可以当成一个数据生成或仿真的底层模块,嵌入你自己的系统里。

八、相关链接

  • 项目官方演示与主页地址:https://jointwm.github.io/

九、总结

回过头来看,Xiaomi Auto WorldModel 的核心价值在于,它用一套独创的深度耦合架构,把快速3D场景重建和高效因果视频生成的能力整合到了一起。这种“一体化”的思路,精准地击中了传统方案在效率、画面稳定性、几何与视觉一致性上的痛点。在重建速度、视频推理效率、长时序稳定性、场景适配性上,它都交出了行业顶尖的成绩单。

更实际的意义是,它不仅能大幅降低仿真测试和训练数据制作的时间与人力成本,还能有效缩小虚拟环境和真实行车场景之间的鸿沟。从闭环测试、数据扩充到算法训练、场景复盘,它的身影无处不在。简洁的使用流程、优秀的兼容性,再加上开源开放的模式,这套框架已经展现出作为底层技术方案的实用性和创新性。对于自动驾驶行业的研发工作来说,这是一个不容忽视的强劲技术支撑。