首页 > 教程攻略 > ai资讯 >MiniMax M3模型Computer Use功能首发:让AI帮你跨应用批量录入发票【自动化】

MiniMax M3模型Computer Use功能首发:让AI帮你跨应用批量录入发票【自动化】

来源:互联网 时间:2026-06-03 14:22:07

你想想看,几十张发片的信息要从PDF或者图片里一个一个抠出来,再逐条填进财务系统、Excel、报销平台……这种重复劳动,不仅耗时,还特别容易出错。那么,有没有什么办法能让这个流程自己跑起来?

MiniMax最新的M3模型,通过它的Computer Use功能,给出了一个相当直接的答案——让AI直接接管你的鼠标键盘,在真实的桌面环境里,完成从识别、整理到录入的全过程,而且是跨应用的。

先说几个前提。要跑通这个流程,你需要先搞定两件事。

第一步:开启Computer Use权限,并授予桌面控制权

登录MiniMax的正式控制台,进入「Model Playground」,选择「M3-12B-Instruct」模型。在右侧的「Capabilities」区域,找到「Computer Use」并勾选,然后点击「Enable」。系统会弹窗提示,需要安装一个叫MiniMax Desktop Agent的客户端。

这里有一个硬性门槛:操作系统必须是Windows 11 22H2或更高版本,旧系统是跑不起来的。

下载安装包后,以管理员身份运行。安装过程会自动注册系统服务,并请求两项权限——「屏幕录制」和「输入监控」。这两项权限缺一不可,否则后续操作会卡在截图阶段。

安装完成后,任务栏右下角会出现一个蓝色的M图标,说明Agent已经就绪。

第二步:上传发片,触发跨应用录入流程

上传文件有两种方式。一种是在Playground的对话框中直接拖入PDF或JPG格式的发片文件,单次最多支持50页,超出部分会自动分批处理。另一种是点击「+」号,选择「Upload Files」,定位到本地发片文件夹,全选后点击「Open」。

文件到位后,直接告诉它:“请将这些发片的发片代码、号码、开票日期、金额、销售方名称提取出来,依次填入我正在运行的用友U8采购管理模块→发片录入界面,字段顺序为:发片代码→发片号码→开票日期→金额→销售方名称。”

注意,指令里必须明确写出目标软件的名称和具体的界面路径,只说“填进财务系统”是不够的。

第三步:监控AI操作,处理异常和中断

指令发出后,你只需要盯住几个关键点。

先看Agent窗口左上角的状态栏。如果出现「Active on U8」的字样,并且鼠标开始自己移动,说明它已经成功切入用友U8的界面了。

接着,留意一下Excel临时生成的log表。每完成一张发片录入,对应的那一行会自动标记「✅ Done」。如果某一行显示「⚠️ OCR Fail」,说明这张发片的图像可能模糊或有遮挡,需要你手动补录一下。

过程中可能会遇到U8弹出「凭证已存在」的提示框。AI默认会点击「否」,然后跳过这张发片。如果你希望强制覆盖,可以在原始指令最后追加一句:“遇到重复提示一律点‘是’”。

全部结束后,Agent会自动关闭U8里所有发片录入窗口,桌面恢复初始状态,不会残留任何未关闭的页面。

MiniMax M3模型Computer Use功能首发:让AI帮你跨应用批量录入发片【自动化】