首页 > 教程攻略 > ai资讯 >连续6天,每天11小时,8台机器人"进厂"的进化史

连续6天,每天11小时,8台机器人"进厂"的进化史

来源:互联网 时间:2026-06-30 13:55:06

先给出一个核心判断:2026年,会是具身智能从“秀肌肉”转向“真干活”的关键拐点。

特斯拉的Optimus计划在这一年实现千台级交付,而智元则在3月底完成了第10000台通用具身机器人的下线,成为全球首个突破万台量产的具身智能企业。两条路线,节奏不同,但指向同一个方向:这项技术正在从实验室的技术验证,走向现实世界的生产力部署。

在上海MWC世界移动通信大会上,智元联合创始人彭志辉点明了这个拐点成立的原因:“大模型智能+本体可靠+数据飞轮”这三件事,第一次在同一个时间窗口里同时成熟。大模型解决了“理解世界”的问题,机器人本体正在跨过“可靠执行”的门槛,真实场景的部署开始形成数据飞轮。三者的汇聚,正推动具身智能从概念走向生产力。

这话说完没多久,700多公里外的江西南昌,龙旗科技的量产工厂里,8台智元精灵G2机器人就开始了同步的全透明产线直播——从早8点到晚7点,和产线工人同时上岗。第二天,累计观看人数就突破了400万。没有剪辑,没有预演,镜头对准的就是工厂里正在发生的一切。这轮直播的意义在于,它是全球首个3C电子产线质检工段实现全覆盖的机器人作业直播。

相比4月份那场只验证单一工序的直播,这次8台精灵G2覆盖了平板电脑的完整质检流程,独立完成多媒体界面测试、音频测试、辐射杂散发射测试和耦合测试等多道高精度检测任务。每一道工序都对位精度、节拍一致性、异常恢复能力提出了不同维度的要求,而机器人严格贴合工厂生产节拍,与产线工人实现了同步连续协同作业。

“我们的目标是跑满‘万级小时’。”龙旗科技机器人业务部副总经理张龙透露,从3月16日并线至今,其中半个月是22小时的白班加夜班连续运转,累计已经跑了近2000个小时。“到了万级小时这个量级,基本就能论证这台机器人在半年以内的连续生产稳定性和故障率,都在我们可接受的范围内。”

值得注意的是,这次进厂的机器人是轮式双臂的“精灵G2”,而非人形。智元Genie业务部项目总监艾文解释了原因:“工厂场景的选择标准是稳定性和精度,长时间作业对精度要求比较高,轮式方案在当前阶段是更好的选择。”

从实验室到产线,一场认知GAP的拉齐

如果只看结果,龙旗的这次落地堪称顺理成章——去年10月宣布合作,今年4月首次直播,6月就实现了全工序覆盖。

然而,真正从实验室走到工厂落地,远没有外界想象得那么一帆风顺。

去年10月合作启动后,团队先在上海搭建了一套模拟系统。然后搬到南昌产线旁的空地上,复制了一条完全一致的产线,用真实环境跑了两个多月。再之后是“百机验证”和“千机验证”。张龙解释了“千机验证”的含义:“在产线外,用一千台以上数量的产品跑完整测试,把一次直通率、设备稳定性、CDK、充电时长、与测试装备和信息系统的对接等所有数据,提交给客户确认。客户认可满足量产需求,我们自己也判断可行,才进入下一个阶段。”这是张龙对这条产线的基本要求。

即便如此,真正并线之后,还是冒出了实验室里从未见过的问题。张龙回忆:“最开始出现的故障,是激光雷达的点云信号在运行一段时间后出现停顿。排查下来发现,是总装之后的线束出了问题。跑了几百个小时都没事,一到产线就暴露了。还有电机刹车片在数千小时后磨损变薄——这些事情,你得跑到一定量才能看到。”

艾文也坦言:“机器人行业从业者对工业场景的理解,和实际需求之间,确实存在GAP。”他举了个具体例子:智元做机器人本体和系统设计,一直参照汽车供应链和汽车质量标准,要求已经很高,但到了真实的3C产线上,标准完全是另一套逻辑。

为了满足3C产线对作业精度、长期稳定性和场景柔性的严苛要求,智元构建了覆盖VLA模型推理、强化学习、感知、决策、全身控制、导航等全链路的核心能力体系,并将这些能力模块封装进一站式开发平台,贴合工厂真实业务流程简化部署逻辑,大幅压缩了产线适配和方案搭建周期,实现跨产线的高效复制落地。

“真实的工厂里,WiFi信号密集,多台设备互相干扰,每一台产品都存在或多或少的累计公差。跑了几个月都没见过的问题,到了产线上一个接一个冒出来。”张龙说这句话时语气平淡,但其中透露的信息很清楚——具身智能工业部署的真正挑战在于,工业级的可靠性,只能在工业级场景里建立起来。

为了8台机器人能顺利接入生产线,张龙和智元为精灵G2设计了明确的“进场三阶段”:2026年做透单一场景,跑通数据;2027年全面拉通设备与管控系统,将工程师的知识点沉淀为数据库;2028年之后,这套形态将给整个制造行业的成本构成带来实质性变化。

从结果看,这些“笨功夫”没有白费。第一次部署一个工位用了48小时,到后面三个工位,基本24小时就能完成。艾文透露,团队把部署过程中的动作编排、调试方法、参数配置全部沉淀进了一套工具。“这套工具可以快速支持在另一条产线做部署,也可以分给二次开发的伙伴。”从逐个调试到可分发、可复用的工具化部署,这个转折比任何单点技术突破都更能说明规模化落地的潜力究竟在哪里。

“三智一体”支撑部署态,从单一场景到多任务

龙旗那6天的全工序直播,最终验证的不只是一台机器能不能干活,而是一套完整的技术体系能不能在工业级场景里长期稳定运转。彭志辉在MWC上把这套体系命名为“三智一体”,即本体、运动智能、作业智能、交互智能四个维度的协同进化。

本体是入场券。智元拥有从全尺寸人形“远征系列”、半尺寸“灵犀系列”到轮式“精灵系列”、四足“酷拓系列”的全场景产品矩阵。量产的节奏也足够直观:2024年6台,2025年1月1000台,2025年底5000台,2026年3月10000台。三年时间,走完从原型到万台量产的跨越。彭志辉还透露,最新的数字里程碑“也将马上揭晓”。

运动智能决定能否稳定执行。智元的BFM基座模型,通过大规模人类动作数据训练出统一的行为基座,让机器人具备零样本适应新任务的能力;而GCFM生成式运控模型,则进一步让机器人从“跟随动作”进化到“自己想动作”。

作业智能是部署态落地的核心。在这条线上,智元构建了从数据、仿真、训练、执行到持续进化的完整闭环。AGIBOT WORLD 2026开源数据集为真实世界理解提供基础;Genie Sim 3.0仿真平台提升部署前验证效率;GO-2具身基座大模型实现任务理解与执行的知行合一;GE-2世界模型则斩获了WorldArena世界模型总分冠军,构建了可推演、可迭代的虚拟环境;而SOP真实世界学习系统,让机器人在真实场景中持续进化。

交互智能决定了融合深度。智元即将发布的WITA-Omni硅光动语大模型,是首个机器人原生端到端全模态交互大模型——它将视觉、听觉与动作融为一体,告别模态拼接带来的信息误差,让语言、语音、表情和动作不再割裂,而是像人一样协调地表达。

未来的具身智能不可能靠一家公司独自完成,必须构建开放、完整、可复制的生态技术体系。智元打造的AIMA架构,就是这样一个产业级底座。AIMA通过统一架构把“三智一体”打通:底层是Link-U OS,向下平台化硬件,向上标准化接口;中间是智能服务层,包括Agent Framework、多模态交互框架、全身运控框架、作业框架;上层则分别对应LinkCraft、LinkSoul和Genie Studio,把运动智能、交互智能、作业智能落成开发平台。再往外,是商业、工业、家庭三大场景,以及整机、硬件、系统软件、解决方案伙伴,还有高校、研究机构、企业开发者。

为了推动生态繁荣,智元启动了“元苼”生态发展计划,未来5年总投入超22亿元,2026年率先投入1亿元,覆盖科研学术创新、教育人才培养、生态伙伴发展、开发社区运营四大方向。同时,还在探索RaaS新模式,通过全球租赁网络平台“擎天租”降低客户使用门槛,让更多企业能用得起、用得好具身智能。从发展模式来看,智元选择的是“全栈自研+开放生态”的路线——既掌握核心技术,又通过开放平台汇聚产业力量。在产业爆发期,生态的广度和深度,往往决定了最终的产业格局。

彭志辉在演讲最后说的一段话,放在这里比任何地方都更合适:今天我们谈“三智一体”,谈的不是一组技术名词,而是一种新的生产力组织方式。机器会成为新的生产力,模型会成为新的基础设施,平台会成为新的创新土壤,生态会成为新的增长引擎。

龙旗产线上那8台精灵G2,正在印证这段话——从“能动起来”到“能干起来”,从“能干起来”到“能创造价值”,从“创造价值”再走向“创造新的产业文明”。这,才是具身智能真正带给人的想象空间。