首页

手游

资讯

专题

首页 > 教程攻略 > ai资讯 >豆包会做任务了，成功帮我薅了瑞幸的羊毛

豆包会做任务了，成功帮我薅了瑞幸的羊毛

来源：互联网时间：2026-06-16 07:46:39

6月15日，豆包悄然全量上线了“任务模式”。打开应用，顶部模型切换栏从原来的“快速、专家”两档，扩展为“快速、专家、任务”三档。

任务模式到底能做什么？直接上手体验一下。向豆包提问：“你能完成哪些任务？”

它列出的能力清单涵盖产品设计与开发、文档创作、数据分析、研究整理、多媒体创作、自动化工具以及浏览器网页操作等多个方向。最后还给出了一个颇为直白的定义：

任务模式=端到端完成任务

。

显然，豆包不再满足于做一个聊天机器人，它正朝着腾讯Workbuddy、月之暗面的Kimi Work这类桌面智能体产品靠近。

不过，体验下来发现：豆包这回走的路子，和市面上不少桌面Agent都不太一样。

一、动手点咖啡，但权限很“克制”

最近瑞幸上线了My Coffee Skill（支持搜索门店、浏览、下单、查询订单等），正好拿来当第一个测试题。

把My Coffee Skill的安装地址发送给豆包，几秒钟后，它开始安装。

整个过程没有任何系统级权限申请弹窗——没有要求访问电脑，没有要求读取本地文件，更没申请浏览器控制权限。安装信息显示，

这个Skill被部署到了独立的运行目录中

。

这意味着至少现阶段，豆包的思路不是先拿系统权限再干活，而是优先通过Skill机制调用能力。

安装完成后，豆包提示需要

配置瑞幸MCP Token

。这个Token可以在瑞幸AI开放平台直接获取。

配置完成后，豆包还贴心地询问是否要保存Token，保存后后续使用Skill就不需要重复配置了。

豆包开始

搜索门店

。这里出现了一个值得注意的现象：它没有主动获取实时位置，而是先整理出门店列表，让我自己指定去哪家取餐。即便是在下单场景里，豆包依然没有动用定位权限。

确认门店后，它开始搜索商品、生成订单。期间

我故意给了一个模糊需求——少冰

。豆包没有报错，而是根据商品规则重新调整配置，再次确认订单。

订单生成后，我打开瑞幸微信小程序对照了一下。发现

商品价格和优惠券使用情况两边都不一致——豆包上下单反而便宜了3角钱

。

完成支付后，豆包继续跟进订单状态，顺利

返回了取餐码

。

几分钟后，咖啡到手。

二、买完咖啡，顺手做一个 App

咖啡下单只是开胃菜。接下来加大难度——把一个咖啡爱好者App的需求直接扔给豆包。

这个App需要能记录每日咖啡、统计咖啡因摄入、生成分享卡片，并支持查看长期数据趋势。

收到需求后，豆包直接进入

任务执行状态

。与普通聊天模式最大的区别在于：

它会主动拆解任务，并实时展示当前执行进度

。用户可以

追加信息

，也可以直接

结束任务

。

随后，豆包给出了一整套交付结果。除了

产品方案和UI设计稿

，还生成了完整的

SwiftUI代码

，以及一个能直接运行的

网页Demo

。

▲产品方案与SwiftUI代码

细看这份完整方案文档，豆包是按照一份

正式产品文档

的结构展开的。

文档开头先给出产品定位，随后拆出产品概述、市场定位、用户画像、核心功能、页面流程与交互设计。其中包括核心用户群体、用户使用场景、贴纸式记录系统、咖啡因智能统计、时间流手账首页、分享创意工坊等更细分的模块。

有意思的是，文档末尾还自动写上了版本号、日期和作者信息。作者一栏显示为“SuperDoubaoAgent Product Team”——豆包给自己临时组了个产品团队。

这份文档出现在一个

可继续编辑的文档编辑器

里，用户可以手动修改，也可以继续调用AI优化。

打开网页Demo，一个

手机模拟器

直接出现在页面中央。

首页展示当天咖啡因摄入量；底部中央按钮用于记录咖啡；

统计页面展示趋势变化；分享页面负责生成分享卡片。

很快发现了一个问题：初始版本底部导航栏中央用于添加咖啡记录的“+”按钮是悬浮设计，但位置明显高于两侧导航按钮，看起来不太协调。

传统开发流程下，需要修改代码、编译预览、再查看效果。但在豆包这里，直接进入了

可视化编辑模式

。

选中按钮后，输入了一句非常简单的话：“与下方其他按钮水平对齐。”豆包随即调整页面布局，重新生成预览。

与很多AI工具依然围绕代码展开不同，豆包这里已经开始尝试把“设计修改”从代码层抽离出来。

直接描述需求，比修改代码更符合直觉

。

另一个细节是

版本管理

。每次修改后，系统自动生成新的版本记录，用户可以在V1、V2等多个版本间自由切换。

三、代码小白的“福利”细节

基础Demo完成后，追加了一个需求：

为每一杯咖啡添加精美贴图

。

豆包立马分析了贴图对产品体验的影响，规划了方案、页面替换方案以及渲染逻辑。随后拆出贴图显示优化、页面渲染更新、功能实现等多个子任务，逐步推进。

修改完成，网页Demo中咖啡记录与选择页面的视觉风格发生了明显变化，

原本简单的文字被替换成了风格统一的咖啡插画

，整体丰富了不少。

贴图的配色延续了产品原本的咖色系设计，没有出现风格割裂。

贴图完成后，继续追问：

还能增加什么功能？

这次豆包直接给出了25+个功能创意。

包括咖啡因摄入预警、年度咖啡报告、咖啡地图，还有咖啡豆收藏、好友打卡、冲煮记录等偏社区方向的功能。对于缺乏产品经验的人来说，相当于多了一个能持续输出创意的

产品经理

。

四、图片、文案、视频，调度更多工具

最后，再加一个更有挑战性的任务：既然App都做出来了，不如顺手生成一支宣传视频。

豆包开始自动规划任务：先调用生图工具生成

宣传图

，再匹配

广告文案

，接着拆解

镜头和分镜

。

不过，在最终视频生成环节，工具出现了异常。豆包判断，很可能是视频工具服务异常。

随后，它主动给出两种替代方案：一种是用现有素材在剪映中快速制作简单视频；另一种是保留完整脚本和分镜，等待后续重新生成。

虽然广告片没成功产出，但整个过程中能明显感受到Agent与传统聊天机器人的区别。

写在最后：

任务模式下的豆包，已经不只是在回答问题，而是能围绕目标任务，调用Skill、连接MCP，协调代码、图片、视频等不同工具共同完成工作。

同时，豆包选择了一条相对克制的路线。从此次体验来看，无论是咖啡下单还是App开发，它都没有主动获取定位权限、电脑控制权限或本地文件访问权限。相比一些强调“接管电脑”的桌面Agent产品，豆包在有限权限下，尽可能完成了更多任务。

对于拥有庞大用户规模的产品来说，这条路或许更容易落地。

从这次上线的任务模式来看，豆包显然已经不满足于继续做一个聊天机器人，开始向桌面Agent方向迈进。而这条赛道上已经站着Codex、Claude Code，以及积累了一定AI办公场景经验的腾讯WorkBuddy。

任务模式或许只是第一步。未来，豆包究竟能接管多少工作，又会以什么方式接管，值得持续观察。

豆包会做任务了，成功帮我薅了瑞幸的羊毛

任务模式=端到端完成任务

一、动手点咖啡，但权限很“克制”

一、动手点咖啡，但权限很“克制”

这个Skill被部署到了独立的运行目录中

配置瑞幸MCP Token

搜索门店

我故意给了一个模糊需求——少冰

商品价格和优惠券使用情况两边都不一致——豆包上下单反而便宜了3角钱

返回了取餐码

二、买完咖啡，顺手做一个 App

二、买完咖啡，顺手做一个 App

任务执行状态

它会主动拆解任务，并实时展示当前执行进度

追加信息

结束任务

产品方案和UI设计稿

SwiftUI代码

网页Demo

正式产品文档

可继续编辑的文档编辑器

手机模拟器

可视化编辑模式

直接描述需求，比修改代码更符合直觉

版本管理

三、代码小白的“福利”细节

三、代码小白的“福利”细节

为每一杯咖啡添加精美贴图

原本简单的文字被替换成了风格统一的咖啡插画

还能增加什么功能？

产品经理

四、图片、文案、视频，调度更多工具

四、图片、文案、视频，调度更多工具

宣传图

广告文案

镜头和分镜

写在最后：

写在最后：

相关阅读

相关下载