RPA+AI,才是真正能让你躺平的自动化真神。
关于RPA与AI的结合,其实一直想聊聊这个话题。只不过之前总觉得时机未到,直到最近看到影刀RPA更新了一个新功能,才意识到真正的转折点来了。
这个功能叫“魔法指令”,说简单点就是——你可以用嘴搭建一套关于网页和数据的RPA流程。听起来是不是有点不可思议?但确实就是实现了。
在聊这个功能之前,先给不太了解RPA的朋友补个课:RPA到底是什么?它和我天天听人说的Agent又有啥区别?
说实话,最近Agent这个词已经快被说烂了。特别是MCP(多模态控制协议)火了之后,好像万物皆可Agent。倒不是说Agent不牛,Agent确实牛,也必然是未来方向。但在当下的时间点,很多人陷入了一种AI幻觉——觉得在现有模型能力下,一切都可以Agent,一切都应该Agent,一切都是Agent最好。
但真正做过落地项目、跑过业务流程的人都知道,Agent跑着跑着,画风就会从“卧槽它自己知道错了会去别的地方找”变成“尼玛怎么又崩了?”“这步又理解错了?”“神经病吧”。越是复杂的流程,越是讲究高精度、不能出错、需要重复运行的业务,一旦Agent的推理链条超过十步,它就开始像是在抽卡——全凭运气。
举个例子,假如要Agent完成20个步骤的流程,哪怕每一步的成功率都达到99%,整体成功率是多少?0.99的20次方,大概是82%。听起来好像还行?但这意味着每5次任务就有一次会失败。关键是,每一步99%的成功率在现实中根本不可能达到。如果每一步只有90%的成功率,那10次尝试里能成功1次就算不错了。这种稳定性在真正需要重复、自动化的生产环境里,根本没法用。
这个逻辑在很多人聊Agent的时候,很少被认真讨论。大家更多沉迷于AI做了一件很酷的事情的表演性场景里,却很少追问:这事能不能每天执行100次、1000次、10000次,连续跑3个月不出错?
之所以这么在意这个,是因为的确有一大堆浪费时间、重复性极高的工作,需要交给程序自动跑。是不是AI其实根本不重要,重要的是能稳定、十年如一日不出错地运行。在这种场景下,应该用的不是Agent,而是RPA——Robotic Process Automation(机器人流程自动化)。
不知道大家有没有玩过手游。十年前玩《碧蓝航线》和《阴阳师》的时候,每天都在里边肝。记得玩《阴阳师》那会儿还在上大学,为了刷六星茨木童子,每天一边看剧一边刷狗粮。副本里可以开自动,但结算和重新开始还得手动点。刷了几天实在受不了,装了个类似按键精灵的APP,记录点的位置和顺序,实现全自动刷狗粮。稳定、重复、日复一日地运行。刷了将近一个月后,式神质量突飞猛进,吊打一众朋友,甚至打进了区竞技场前十。
这东西叫脚本,也是RPA最最最基础的用法。真正的RPA远比这高级,涉及数据的处理流转、规则判断、自动化点击操作等等。
过去大家觉得RPA老、慢、土、企业服务感太强,觉得AI才是未来。但现在回头看,Agent就像带情绪的实习生——有创意、有想法,但经常会搞砸细节;而RPA像老成稳重的机器人工人——没太多脑子,但给个流程就一遍遍照着跑,重复、稳定、精准、不多想。
国内最有代表性的RPA产品,就是影刀。他们自己也做过一张对比图,深表赞同。Agent确实酷,像Manus、DeepResearch这些产品几乎是日常最常用的,尤其是OpenAI那个DeepResearch,每个月150次都不够用。但场景不一样,在重复性场景里,它们还是太有个性、太聪明了。
自动化真正需要的是:更稳、更可控、更可复用。而不是更聪明。极度重复的工作,需要的就是十年如一日稳定运行。要聪明干嘛?聪明但不靠谱,还不如不聪明。
但RPA一直有一个大问题:上手太难了。即使不懂AI、不懂编程,你依然可以用Cursor、Trae搓出一个小产品,依然可以用DeepResearch生成一份几万字的报告。但RPA不会,就是真不会。
比如想做个网页自动化,打开界面,没用过的话真的会懵。想从抖音扒评论,这是RPA搭好的详细流程——别说搭了,大概率看都看不懂。要搭流程、画模块、定义变量,像程序员一样思考逻辑。影刀这些年一直在努力降低门槛,加了可视化、模块化、拖拽式逻辑配置,但还是太复杂,本质上还是在做开发,只是形式换了。
这两年AI Coding飞速发展,一直期待像影刀这样的产品能出一个用AI搭建RPA流程的功能。AI的本质就是降维、就是技术平权。RPA很有用,但太难,大家用不了搭不来,那为什么不可以用嘴跟AI提需求,让它转成RPA流程呢?等了大半年,终于看到了。
虽然目前只能生成网页和数据处理的RPA流程,还不能生成桌面端跨软件(比如微信)的流程,但已经看到了一个非常棒的转折点。RPA+AI,才是自动化任务的
终极方案
下载安装影刀后,在主界面点击“新建 - 新建PC自动化应用”,进入流程搭建页面。在标准指令里,就能看到那个彩色的“魔法指令”。在用之前,记得先进主界面 - 头像 - 工具 - 自动化插件,把各种浏览器的插件装上,否则后续运行会失败。
举个简单的例子:想做一个自动化流程用于学习。每天在小红书搜索关键词“AI”,把前50个笔记爬下来,存到excel里,再按一定数据公式找出优质内容,提取存储,最后扔到飞书多维表格里。
直接点开“魔法指令”,进入浮窗。它默认就是网页自动化,所以不需要改。然后打开Chrome浏览器,打开小红书网页。左边是网页,右边是影刀的魔法指令浮窗。
直接用嘴写指令。不过影刀有个必须步骤叫“捕获元素区”。比如要说“在搜索栏里输入AI,然后点击搜索按钮”,这个prompt不够精准,后续运行时可能出问题。所以需要先捕获元素区,明确告诉它这是搜索栏、这是搜索按钮。
点击左下角的icon,屏幕变绿,就可以在页面上框选区域了。把鼠标放在搜索框的选区上,按Ctrl+Shift再鼠标左键单击,确认后选区就出现在对话框里。接着用嘴告诉AI对这个元素块做什么操作:“在输入框中输入‘AI’”。然后继续捕获搜索按钮:“点击块元素(搜索按钮)进行搜索”。后面流程一样:圈中整个笔记区,按笔记链接、作者、标题、正文、点赞数、收藏数、评论数等爬取,存到本地excel里。
写完prompt后,还可以点一下“优化提问”提高成功率。优化完后格式正规很多。一切就绪后发送出去。过一会儿会生成魔法指令窗口,提示需要安装依赖库的直接点击安装。RPA流程就生成了,保存路径可以手动修改。然后点击左下角的“运行指令”测试一次,直接完美成功。
看RPA干活,真的是一种享受。本地excel结果完美无瑕。而且这东西保存后可以十年稳定运行(只要小红书不改界面),做一次就能一直用。还能扩展到存50、100、200个笔记,每天抓取一次。生成完的流程记得点“确定”,因为它只是流程还不是应用。确定后回到主界面,记得先拖一个“打开网页”到主流程,以后一运行就会自动打开小红书了。
如果想自动进行一轮数据筛选,可以继续点“魔法指令”,这次用“数据处理”帮处理excel。得到结果后自定义输出文件,再运行测试。遇到bug可以直接点“智能修复”。成功后能筛选出22条。最后,还可以把这些处理完的数据自动上传到飞书多维表格里。以后每天只要打开影刀运行一次,就有全新的AI领域小红书爆款内容。甚至可以跟触发器打通,每天定时自动运行。
除了这个,还搓了几个其他流程。比如每次新出图模型,用excel测试集去测特别麻烦,因为新模型几乎不可能开放API。现在可以直接用嘴搓个自动生图流程(比如在即梦上批量生图),然后塞到飞书里。以后真的解放双手。
写到这里,发自内心想说一句:这两年很多时候都在追问AI能不能干人干不了的事。但其实那些重复、琐碎、机械、知道流程却不想动手的任务,更希望AI能把它
干得更好
这可能,就是魔法。
也愿我们每个人,都能拥有魔法。