首页 > 教程攻略 > ai资讯 >智动未来联合蔡盼盼团队发布MINT-4B VLA模型

智动未来联合蔡盼盼团队发布MINT-4B VLA模型

来源：互联网时间：2026-06-06 13:47:00

就在最近，广东智动未来和上海创智学院蔡盼盼教授团队联手放了个大招——正式发布了MINT-4B多模态VLA（视觉-语言-动作）大模型。这台模型凭啥引起关注？一句话：它的泛化能力和实机表现相当能打。在英伟达等国际巨头参与的全球主流通用机器人大模型评测中，它直接杀入前三甲，技术指标甚至压过了OpenVLA、GR00T、π、UniVLA这些标杆级选手。

核心创新：复刻意图而非轨迹

MINT系列最核心的突破点在于——它不追求机械复刻训练时的动作轨迹，而是理解任务背后的意图。传统VLA模型环境一变就容易掉链子，因为太依赖记忆中的轨迹。而MINT-4B独创了SDAT多尺度频域分词技术，把任务拆成顶层意图和底层执行细节两层，通过跨尺度自回归推理实现分层解码。这样一来，模型知道“该做什么”，而不是仅记住“怎么做”。可以说，传统VLA模型环境适应性差的老大难问题，算是找到了一个很通透的解法。

这套设计带来的直接好处是：面对新场景、新物体、新任务，MINT-4B不需要重新训练就能快速适应。机器人在真实世界里的部署效率，一下子就上来了。

全球评测前三，技术指标领先标杆

在英伟达等行业巨头及国际权威专家组织的全球主流通用机器人大模型评测中，MINT-4B成功跻身前三。与OpenVLA（NVIDIA）、GR00T（NVIDIA）、π（Physical Intelligence）、UniVLA（腾讯Robotics X）等国际标杆模型正面较量，多项技术指标占优，证明了国产VLA模型在全球第一梯队的硬实力。

已落地小智S2人形机器人，全国多地商用

目前，MINT-4B技术已经搭载到了智动未来小智S2人形机器人上，覆盖科教研学、商业展厅等实际场景。配套的开发与实训一体化方案，有效降低了落地成本和部署门槛。这台机器人已经在国内多个地区实现了商用落地，从实验室到产业化的完整闭环，算是跑通了。

智动未来联合蔡盼盼团队发布MINT-4B VLA模型

核心创新：复刻意图而非轨迹

全球评测前三，技术指标领先标杆

已落地小智S2人形机器人，全国多地商用

相关阅读

相关下载