首页 > 教程攻略 > ai教程 >爆火的Manus好用吗?我们给它出了10个难题

爆火的Manus好用吗?我们给它出了10个难题

来源:互联网 时间:2026-06-28 07:19:34

又一次狂欢开始了。

“扔冲击波”、“AI双星”、“再革OpenAI的命”……这些震耳欲聋的夸耀,似乎要复制一个deepseek式的成功。新产品叫Manus,官方称其为全球首款通用性Agent。

Manus能做什么?官网上密密麻麻的demo陈列,从做旅行攻略、股票分析、生成课件到审合同,功能强大得像童话故事。这也直接导致“一码难求”——据《第一财经》报道,内测码一度被炒到9万元一个。

为了给出真实的判断,我们向开发团队申请到了内测码。以下,就是这次实实在在的体验。

(测试的开头就不太顺——有码在手,却在注册页面从早上9点卡到了下午1点半。)

先说总结:Manus是一个运行在虚拟机中的多Agent架构,包含一个负责任务拆解的规划型Agent、一个调用具体工具的执行型Agent,以及一个跟踪进度和debug的监控验证型Agent。说白了,它的理解能力、工具调用能力和计算机资源调度能力,都必须非常强,才能将复杂任务拆解成可执行的步骤并保证效率。

内测用户每天有10个任务配额。当我们给它第11个任务——让它“做个梗图”时,它告知已经达到使用上限。很遗憾,没能测到它的“情商”。

在高级模式下,让它写一篇文章,处理时长大约在30分钟到1小时。普通模式下,比如写一个HTML页面,大约需要15分钟。

我们测试的功能包括:分析上市公司股价、设计网页、写研报、填表、甚至游戏“代打”。完成情况有好有坏,以下是部分回顾。

这些任务让我惊喜

今日最佳,非“世界时钟.html”莫属。别说,Manus写出来的网页还挺符合审美,“添加时区”、“删除时区”、“下载”等交互也都没问题。

第二个惊喜是,我让Manus去一个“外国版4399”网站上自己找个游戏玩(现在回想起来,这个需求确实很抽象)。它成功访问了网站,在多个游戏类别里选中了一个赛车游戏,读取了网页和图片信息,点击了“Play Now”,在游戏界面里自行选择了“汽车”和“竞速模式”。

游戏开始后,Manus控制的车却停在原地。我意识到它可能不太了解游戏机制,提示“请用WASD开车试试”后,车居然……跑起来了(速度就别强求了)。

在这个任务里,AI Agent展现出一定程度的可自主操作性——这是它能独立完成工作的前提。

这些任务“不太行”

当我让Manus写一个“浪漫高级的生日祝福网页”时,不仅无法交互——图片、应该满屏闪烁的爱心、音乐都无法点击,连审美也差强人意,选用了非常正式的“宋体”。当要求用本世纪的审美重新生成后,始终访问不到虚拟机中的最新版网页。

按理说,想做得更美观,可以通过提示词让它继续修改。但不止这个任务,其他任务下也经常提示“负载过高,服务器出错”。所以我们没有执拗于生成一个极其精美的网页——按今天AI的能力,做个在线抽奖系统之类的应该不成问题。

一些“正经活儿”上,Manus的表现也低于预期。我让它分别做了一个“高分子材料性能预测与仿真”研究报告,以及一篇关于“碳纤维结构件”的科普文章。

我想测试两个能力:一是它在垂直领域的深度检索和信息处理能力,二是按照特定要求和格式交付的能力——这是区分AI通用搜索的重要两点。

这个任务里,它有几点不足:

·

过度推理

:比如,当我只希望AI研究碳纤维的生产工艺时,它会发散性地总结大量市场分析和行业应用信息。

·

信息来源不足

:Manus的思考过程是清晰展示出来的,能看到它正在浏览哪些文章、视频资源。但其引用的资源大多来自中文聚合平台和国内期刊,缺少国外期刊及第一手资源。

·

无法按特定格式交付

:比如,我希望Manus直接生成一个能向老板汇报的PPT,最终却只得到了一个markdown格式的中间态。

·

多次需要人工接管

:抓取某些内容平台或付费墙内容时,需要手动登录账号。看来,AI Agent也解决不了“数据边界”问题。

最后一类任务——让AI替代填写表格(财务人估计狠狠点了),是我最期待,也是我认为团队应该优先优化的需求之一。

我上传了一张医保发片和一份保险申请书,让AI“把申请书里原本金额部分清空,并填入新发片中的信息,金额以自付部分为准”。

AI无法真正理解表格结构以及每一处信息的真实含义——比如没有修改日期、覆盖了金额和时间之外的信息(把我的身份证号删除了)、或者找不到信息该在的位置。这个任务中还多次出现计算资源不足的情况。

也许,对于需要AI精准“定位”的任务,我在给提示词时也应该更精准、更“按部就班”。但这也反映出,AI在发挥想象力、凭空生成的任务上,比在已有框架下修改更容易、效果更好。

就好比让一台机器人“拿杯水过来”——它能通过各种传感器计算出你在它2点钟方向、往前走10步就行呢?还是不管不顾冲到你面前,给你一个“大比兜”?当执行足够精准时,就是前者——AI Agent能给你一篇可以拿去忽悠老板的PPT。否则,你只能拿着AI的“半成品”修修补补。

任务完成得虽然不尽如人意,但也不是没有优点。通过看每个任务下的思考过程,确实能窥见AI Agent的推理思维链。比如,当我以小米SU7 Ultra引出碳纤维结构件问题时,它的思考过程是从点切入,逐渐展开。即便它总结的备忘录只是个半成品,也给了我很大启发。

很多时候,Manus遇到问题后会告知它正在自行修正和处理。它还有一定的“记忆机制”,会跟你确认是否需要按照你的偏好继续生成。

总的来说,这款全新产品还是赋予了大众很多应用上的想象力,也尽可能覆盖了主流需求。但话说回来,AI Agent应该是一个非常个人化的东西,所以更期待它在解放生产力上的进步和表现。

相关下载