Manus把AI替代人具象化
Manus AI智能体最近掀起了一波不小的热度。官方放出的案例视频,让人直观感受到“AI替代人”这件事不再停留在概念层面,而是有了可以落地的模样。不过,体验门槛也确实存在——邀请码机制让多数人只能看个热闹。好在官方提供的案例足够丰富,下面结合这些案例,拆解一下Manus的能力边界,再聊聊它对未来的启示。

01 Agent的“前世今生”
很多人听到Manus被称为“智能体”时有点懵:这和平时用的ChatGPT这类大语言模型(LLM)有什么区别?
其实Agent本身并不是新概念,理论雏形可以追溯到上世纪90年代。但它的潜力真正被释放,是在2022年大模型爆发之后。用Anthropic公司的定义来说:“智能体能够动态地决定自己的执行流程和工具使用方式,自主掌控任务的完成过程。” 翻译成大白话:Agent就像一个小助理,不仅会说话,还会规划、会调用工具,一步步把事情搞定。LLM底座是它的“大脑”,而Agent则是让这个大脑动手干活的关键。
举个例子:假设一位初中物理老师需要准备动量守恒定律的演示动画,并且要组织成一个HTML演示文稿。
- 传统LLM只能给你一段代码脚本,告诉你“复制到浏览器运行”——使用者还得懂代码、会调试。
- Agent则可以直接交付成品。Manus的案例显示:它会自动拆解成6个子任务(搜索资料→浏览网页→设计代码→调用开发工具→调整结构→检查交付),像不像一个全能助理?直接帮你搞定。
02 Manus的体验
看了一圈网上的体验视频和官方案例,梳理出几个关键点(图片建议点击放大看,截图细节较多)。
真正让人惊艳的有三点:
- :不需要人工预设工作流,也不需要懂技术的人提前编排。Agent能根据任务目标自主拆解步骤,过程中根据反馈修正。这碘伏了大众对AI“只能聊天”的认知。
自主规划与动态调整
- :内部有规划Agent、进度追踪Agent、执行开发任务的Agent……它们像团队一样协同,可以像人一样操作电脑。
多Agent协作
- :你能看到一个虚拟屏幕实时显示执行过程,类似DeepSeek R1的推理细节展示,让人看到AI每一步在干什么。
任务过程透明化
特点总结:当前Manus擅长的任务类型以
搜索+信息整理+分析与可视化
03 之前的Agent对比
需要对比一下Manus和之前的Agent玩法。从搭建经验来看,过去构建Agent通常需要人工深度参与:比如做一个旅行攻略Agent,得先分析任务场景(文本生成类),然后人工拆解成若干步骤,每一步用Prompt设定好目标(相当于每一步调用一个大模型或外部插件),最后拼装起来。整个过程依赖开发者编排和调试。
而Manus这种方案,Agent能自主规划任务并模拟人与外部系统的交互。推测其实现方式是将几类任务能力训练成类似DeepSeek R1的推理模式——把任务拆解和规划泛化成Agent的固有技能,不再需要开发者手动拆解和调试。这可能是未来AI应用层的一个重要趋势:终极形态是Agent直接具备专项任务的规划能力。
当然,因为没有亲身体验到,目前还需要留意几个潜在问题:官方Demo可能省略了出错或需要人工干预的步骤;大模型本身存在幻觉;当前调用的第三方工具还比较有限(主要是网页开发和可视化)。
04 趋势与影响
从这些变化中可以提炼出几个方向性的判断:
- :过去需要掌握Prompt技巧、Workflow编排、Agent设计,现在这些技能正在被大模型内置。很多套壳大模型的Workflow型Agent可能会快速消亡。
AI使用门槛大幅降低
- :取而代之的是Agent自主安排任务、根据反馈动态调整。未来可能不需要大量软件定制开发,智能体直接就能实现需求。
强规则/人工干预的Workflow将退出
- :Manus在虚拟机上操作,并有视觉模型监控过程,这本质上是在模拟人与物理世界的交互——是通向AGI的关键路径。
虚拟操作+视觉监控
- :未来大模型负责规划,小模型负责专项任务解决。真正的壁垒或许在于训练垂直场景的小模型。
大小模型分工