豆包想赚钱,要先Codex化
这不,6月初的AI圈,两件事就这么撞到了一起。
一件是OpenAI的Intelligence at Work发布会。会上,官方宣布Codex的周活用户已突破500万,相比年初暴涨了8倍。更值得注意的是,非开发者用户——分析师、营销人员、运营、设计师、研究员、投资人、银&行从业者——已经占到Codex整体用户的20%。这部分用户的增长速度,是开发者的3倍以上。而且,未来几周内,更多Codex功能将被直接整合进ChatGPT App。
另一件,是豆包官方发了一篇公众号长文,正面澄清了“豆包专业版”的传闻。文章明确表示,这个专业版将覆盖软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究六大领域。目前PC端已开放内测,手机端暂时还未上线。
两条消息几乎同步出现,传递的信号很明确:无论是ChatGPT还是豆包,都判断Agent全面走向大众的时机已经成熟。目标不再是简单的对话,而是帮助更多人真正去做事——从对话到执行,这才是AI助手下一步的方向。
话说回来,ChatGPT和豆包都是用户量庞大的AI助手,却都面临共同的问题:不怎么赚钱。不过近几个月,OpenAI已经通过Codex获得了不错的营收增长。从这个角度看,豆包专业版想堂堂正正地赚钱,似乎也得走上“Codex化”这条路。
01
豆包,眼下缺的恰恰是Codex
豆包,眼下缺的恰恰是Codex
尽管豆包的月活用户在国内排第一,但对很多用户来说,它仍更像一个娱乐工具,很难成为真正的工作搭子。这一点,从“豆包要收费”话题传出后,部分用户“笨还收费”的真实反应就能看出来。眼下,豆包急需扭转自己在用户心中的形象。
被寄予厚望的豆包专业版,声称能做大多数白领的工作。据我们了解,本月底配合专业付费版一起上线的,还将有豆包即将更新的模型。新模型预计能显著提升豆包在工作流上的表现。
最近有报道指出,今年字节跳动的几个重要命题中,包括进一步打好Coding的地基,做好Coding的Dogfooding——也就是数据回流、评测,形成飞轮——从而提升Agent能力。另一个重点则是强化豆包的商业化能力,而核心场景就是“办公”。
豆包专业版覆盖的六大领域——软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究——与OpenAI的Codex全面覆盖的方向完全一致。今年6月的发布会上,Codex就宣布了六大岗位的Agent插件,涵盖数据分析、销售、创意制作、产品设计、股权投资和投行。每个插件都内置了对应岗位所需的工具连接、领域知识和操作流程,相当于让你拥有一个懂全流程的同事搭子。
相比于ChatGPT更多聚焦在写作、创作和对话,今年2月推出的Codex桌面版已经能本地运行,可以直接读取电脑里的文件,甚至可以调用飞书等外部工具。在生产力服务上,Codex拥有更多权限,操作方式也更接近人类。
Codex融入ChatGPT的野心,并不仅仅是成为超级应用,而是看到了用户结构变化的拐点。要知道,Codex早已不只被当作编码工具。今年用户结构发生了显著变化:分析师、设计师、投行从业者等非开发者用户迅速增长,增速是开发者的3倍。目前,Codex中知识工作者的占比已达到20%。OpenAI称,2026年第一季度的营收预计约57亿美元,而最重要的增长引擎正是表现强劲的Codex。
和OpenAI相同的是,要想在知识工作者圈层塑造专业形象,豆包的用户规模确实是一大优势。但区别在于,OpenAI的Codex已经运作了一年,才形成如今不错的口碑。豆包想要在六大领域实现专业收费,并不容易。尤其在软件开发能力上,需要面对代码仓库、权限、安全、上下文窗口、测试、依赖、多人协作等一系列问题。目前,豆包模型在Coding上的表现并不出众,口碑似乎也不如Kimi和智谱。
不只是软件开发,金融分析、科学研究等领域,每一项专业能力都将面临极为严苛的审视。日常使用中,用户对AI的出错包容度相对较高,但一旦涉及业务收入、合规等复杂场景,人们对AI出错的容忍度几乎为零。
一位用户在豆包专业版的说明文章下留言得很直白:别只当个更聪明的聊天框,多花心思把专业软件的API和工作流真正打通,大家才会心甘情愿付费。
02
豆包的Agent底座是谁?
豆包的Agent底座是谁?
这场专业版的仗并不好打。豆包靠免费模式打天下几年,DAU已经做到了国内AI助手第一,但一直缺乏清晰的变&现路径。切入办公场景、推出付费专业版,只是豆包商业化落地的第一步。如果OpenAI能够通过组织架构调整和产品统一的方式走通超级应用模式,那豆包也未必不行。ChatGPT有Codex,而豆包背后,还有字节的TRAE或者扣子。
从娱乐工具到办公搭子,豆包并非孤军奋战。2026年3月底到4月初的信息显示,TRAE SOLO已经从纯粹的AI编程工具,升级为通用Agent工作台。除了为开发者保留的Code Mode,新增的核心模式是Agent Mode,面向产品经理、数据分析师、运营等非开发用户,尤其适合处理文档、数据、演示稿等。为了强调自己不止于编码,TRAE界面醒目地写着:“不止于码,大有可为”。网页版底部也标注着:“双模式智能体,Work模式与Code模式一键切换”。
这意味着原本专注服务开发者的小众工具,如今已经不甘于局限在编程领域,而是想成为一个能被更多人使用的通用Agent生产力平台。

除了TRAE,字节另一个真正意义上的Agent产品是扣子(Coze)。它本身就是一个Agent平台,大家常说的编程功能,只是它众多分支能力之一。6月1日,扣子3.0的电脑端和App迎来全面升级,官方表示,把Agent带进了更完整的工作现场:用户可以在网页端创建和管理任务,在桌面端连接本地文件,也可以在手机上用扣子App推进任务、调度Agent,甚至远程操作电脑。
这些都是Agent的核心属性。新版扣子的最大亮点在于:对于已经习惯在本地使用Claude Code、Codex CLI、OpenClaw的用户,现在也可以把它们接入扣子。这些本地Agent不再局限于各自的工具中,而是可以进入扣子同一个项目空间,与其他Agent一起围绕同一目标协作推进。让别人的Agent也能运行在自己的平台上——这意味着扣子有着更大的野心:争夺Agent平台层。
不妨大胆假设一下。相比更偏代码执行层的TRAE,如果扣子的Agent底座能力能接入豆包,或许是豆包专业版的最优解。扣子擅长的流程自动化、多工具调用、低代码搭建、办公助手、插件、知识库、工作流等能力,几乎可以横向覆盖豆包专业版的多个方向。当用户在豆包里提出“帮我分析这家公司”“生成一份投研报告”或“把表格清洗后做PPT”的需求时,背后实际上是由扣子式的Agent来拆解任务、调用工具、连接知识库、跑完整个流程。
这对扣子和豆包来说是双赢:扣子能快速承接豆包的庞大用户规模,改变以往数据有限的困境;豆包也能在办公场景中建立起自己的用户心智。当前最大的难题在于,豆包和扣子这两个字节内部的不同组织,能否真正协同起来,把这件事做成。