首页 > 教程攻略 > ai资讯 >豆包会做任务了,成功帮我薅了瑞幸的羊毛

豆包会做任务了,成功帮我薅了瑞幸的羊毛

来源:互联网 时间:2026-06-16 07:46:39

6月15日,豆包悄然全量上线了“任务模式”。打开应用,顶部模型切换栏从原来的“快速、专家”两档,扩展为“快速、专家、任务”三档。

任务模式到底能做什么?直接上手体验一下。向豆包提问:“你能完成哪些任务?”

它列出的能力清单涵盖产品设计与开发、文档创作、数据分析、研究整理、多媒体创作、自动化工具以及浏览器网页操作等多个方向。最后还给出了一个颇为直白的定义:

任务模式=端到端完成任务

显然,豆包不再满足于做一个聊天机器人,它正朝着腾讯Workbuddy、月之暗面的Kimi Work这类桌面智能体产品靠近。

不过,体验下来发现:豆包这回走的路子,和市面上不少桌面Agent都不太一样。

一、动手点咖啡,但权限很“克制”

最近瑞幸上线了My Coffee Skill(支持搜索门店、浏览、下单、查询订单等),正好拿来当第一个测试题。

把My Coffee Skill的安装地址发送给豆包,几秒钟后,它开始安装。

整个过程没有任何系统级权限申请弹窗——没有要求访问电脑,没有要求读取本地文件,更没申请浏览器控制权限。安装信息显示,

这个Skill被部署到了独立的运行目录中

这意味着至少现阶段,豆包的思路不是先拿系统权限再干活,而是优先通过Skill机制调用能力。

安装完成后,豆包提示需要

配置瑞幸MCP Token

。这个Token可以在瑞幸AI开放平台直接获取。

配置完成后,豆包还贴心地询问是否要保存Token,保存后后续使用Skill就不需要重复配置了。

豆包开始

搜索门店

。这里出现了一个值得注意的现象:它没有主动获取实时位置,而是先整理出门店列表,让我自己指定去哪家取餐。即便是在下单场景里,豆包依然没有动用定位权限。

确认门店后,它开始搜索商品、生成订单。期间

我故意给了一个模糊需求——少冰

。豆包没有报错,而是根据商品规则重新调整配置,再次确认订单。

订单生成后,我打开瑞幸微信小程序对照了一下。发现

商品价格和优惠券使用情况两边都不一致——豆包上下单反而便宜了3角钱

完成支付后,豆包继续跟进订单状态,顺利

返回了取餐码

几分钟后,咖啡到手。

二、买完咖啡,顺手做一个 App

咖啡下单只是开胃菜。接下来加大难度——把一个咖啡爱好者App的需求直接扔给豆包。

这个App需要能记录每日咖啡、统计咖啡因摄入、生成分享卡片,并支持查看长期数据趋势。

收到需求后,豆包直接进入

任务执行状态

。与普通聊天模式最大的区别在于:

它会主动拆解任务,并实时展示当前执行进度

。用户可以

追加信息

,也可以直接

结束任务

随后,豆包给出了一整套交付结果。除了

产品方案和UI设计稿

,还生成了完整的

SwiftUI代码

,以及一个能直接运行的

网页Demo

▲产品方案与SwiftUI代码

细看这份完整方案文档,豆包是按照一份

正式产品文档

的结构展开的。

文档开头先给出产品定位,随后拆出产品概述、市场定位、用户画像、核心功能、页面流程与交互设计。其中包括核心用户群体、用户使用场景、贴纸式记录系统、咖啡因智能统计、时间流手账首页、分享创意工坊等更细分的模块。

有意思的是,文档末尾还自动写上了版本号、日期和作者信息。作者一栏显示为“SuperDoubaoAgent Product Team”——豆包给自己临时组了个产品团队。

这份文档出现在一个

可继续编辑的文档编辑器

里,用户可以手动修改,也可以继续调用AI优化。

打开网页Demo,一个

手机模拟器

直接出现在页面中央。

首页展示当天咖啡因摄入量;底部中央按钮用于记录咖啡;

统计页面展示趋势变化;分享页面负责生成分享卡片。

很快发现了一个问题:初始版本底部导航栏中央用于添加咖啡记录的“+”按钮是悬浮设计,但位置明显高于两侧导航按钮,看起来不太协调。

传统开发流程下,需要修改代码、编译预览、再查看效果。但在豆包这里,直接进入了

可视化编辑模式

选中按钮后,输入了一句非常简单的话:“与下方其他按钮水平对齐。”豆包随即调整页面布局,重新生成预览。

与很多AI工具依然围绕代码展开不同,豆包这里已经开始尝试把“设计修改”从代码层抽离出来。

直接描述需求,比修改代码更符合直觉

另一个细节是

版本管理

。每次修改后,系统自动生成新的版本记录,用户可以在V1、V2等多个版本间自由切换。

三、代码小白的“福利”细节

基础Demo完成后,追加了一个需求:

为每一杯咖啡添加精美贴图

豆包立马分析了贴图对产品体验的影响,规划了方案、页面替换方案以及渲染逻辑。随后拆出贴图显示优化、页面渲染更新、功能实现等多个子任务,逐步推进。

修改完成,网页Demo中咖啡记录与选择页面的视觉风格发生了明显变化,

原本简单的文字被替换成了风格统一的咖啡插画

,整体丰富了不少。

贴图的配色延续了产品原本的咖色系设计,没有出现风格割裂。

贴图完成后,继续追问:

还能增加什么功能?

这次豆包直接给出了25+个功能创意。

包括咖啡因摄入预警、年度咖啡报告、咖啡地图,还有咖啡豆收藏、好友打卡、冲煮记录等偏社区方向的功能。对于缺乏产品经验的人来说,相当于多了一个能持续输出创意的

产品经理

四、图片、文案、视频,调度更多工具

最后,再加一个更有挑战性的任务:既然App都做出来了,不如顺手生成一支宣传视频。

豆包开始自动规划任务:先调用生图工具生成

宣传图

,再匹配

广告文案

,接着拆解

镜头和分镜

不过,在最终视频生成环节,工具出现了异常。豆包判断,很可能是视频工具服务异常。

随后,它主动给出两种替代方案:一种是用现有素材在剪映中快速制作简单视频;另一种是保留完整脚本和分镜,等待后续重新生成。

虽然广告片没成功产出,但整个过程中能明显感受到Agent与传统聊天机器人的区别。

写在最后:

任务模式下的豆包,已经不只是在回答问题,而是能围绕目标任务,调用Skill、连接MCP,协调代码、图片、视频等不同工具共同完成工作。

同时,豆包选择了一条相对克制的路线。从此次体验来看,无论是咖啡下单还是App开发,它都没有主动获取定位权限、电脑控制权限或本地文件访问权限。相比一些强调“接管电脑”的桌面Agent产品,豆包在有限权限下,尽可能完成了更多任务。

对于拥有庞大用户规模的产品来说,这条路或许更容易落地。

从这次上线的任务模式来看,豆包显然已经不满足于继续做一个聊天机器人,开始向桌面Agent方向迈进。而这条赛道上已经站着Codex、Claude Code,以及积累了一定AI办公场景经验的腾讯WorkBuddy。

任务模式或许只是第一步。未来,豆包究竟能接管多少工作,又会以什么方式接管,值得持续观察。

相关下载