首页 > 教程攻略 > ai资讯 >Codex撞脸Claude Code,新功能只领先11天

Codex撞脸Claude Code,新功能只领先11天

来源:互联网 时间:2026-06-07 12:48:18

Codex和Claude Code长得越来越像了。

最近,开发者Elie Bakouch注意到,这两款AI编程智能体在功能上几乎同步迭代——连斜杠命令的名字、技能文件的格式,甚至“dreaming”这种记忆机制的命名都撞上了。他好奇到底哪家在领跑,干脆把双方共有的功能按发布时间拉了一张时间线。


时间线跨度从2025年2月到2026年6月,橙色代表Claude Code,蓝色代表Codex。每一行对应一项双方都拥有的功能,从/goal、子智能体(subagents),到OpenAI近期推出的“dreaming”记忆机制,全部囊括。


统计结果令人印象深刻:24项共同功能中,Claude Code抢先发布了18项,Codex只有4项占先,剩下2项存有争议。单看这张表,橙色几乎铺满了前半段,Claude Code明显是那个领跑的节奏。

更值得注意的是,两家的发布时间点越来越近。一项新功能的先发优势,正在以天为单位蒸发。Codex先发的4项里,有2项被Claude Code几乎贴身扳回:/goal是Codex先上,11天后Claude Code追平;多智能体并行,同样是Codex先发,Claude Code用了11天追上。两次反扑,都没超过两周。

相比之下,Codex接下来要啃下的清单更长。你追我赶之中,双方撞车的不仅是时间,连命令名称和文件格式也开始重合。AI编程智能体的产品形态,正在逐渐收敛成同一张面孔。

18比4:Claude Code赢在了起跑线

Elie整理的这份清单,覆盖了Claude Code和Codex从发布至今的24项共同功能。虽然这是他个人整理,交叉了npm发布时间、GitHub release和博客公告,并未逐条与最新版本核对,但大趋势清晰可见。

Claude Code比OpenAI新版Codex早大约80天推出。它于2025年2月率先以终端里的编程智能体形态亮相,Codex要到5月才以云端软件工程智能体的形式发布。正是这80天的领先,加上后续紧凑的更新节奏,让Claude Code在24项功能中抢占了18项先发优势。

这些功能包括无界面脚本化(headless)、模型上下文协议(MCP)、自定义斜杠命令(custom slash commands)、上下文压缩(context compaction)、子智能体(subagents)、生命周期钩子(hooks)、技能(skills)等。而作为后发者,Codex也在内置沙箱(built-in sandboxing)、云端异步智能体(cloud async agent)、多智能体并行团队(multi-agent teams)、目标模式(Goal mode)等几项上先行一步。

还有两项被Elie标为争议项。检查点与回滚(checkpoints/rewind):如果按“能撤销代码改动”这个更强定义看,Claude Code的/rewind更接近完整检查点回滚;如果按“会话回退/分叉”看,Codex侧也有较早记录。记忆dreaming(memory dreaming)的争议在于:只看“记忆”能力,OpenAI早在ChatGPT memory中推进;但如果看“dreaming”这个名称以及回看历史、自我复盘的机制,Anthropic在Claude Managed Agents中于2026年5月6日公开推出。撇开这两项,18比4,Claude Code的领跑优势肉眼可见。


其实,“Codex”这个名字不是2025年才有的。OpenAI早在2024年就发布过Codex模型,用自然语言生成代码。但Elie比较的是2025年才上线的Codex编程智能体。OpenAI明明在AI编程上起了个大早,却把编程Agent的先发优势让给了Claude Code。旧Codex证明了“模型会写代码”,Claude Code则率先把这件事做成了开发者愿意日常使用的智能体产品。

功能像素级对齐:是抄袭,还是收敛?

这场贴身肉搏中,两家的功能正贴着脸往一块儿长,已经不是单点撞车,而是关键能力成组对齐。最典型的就是/goal。

Claude Code最新文档中,/goal的定义是:设定一个完成条件,它会跨多个回合一直执行,直到条件满足才停止。每跑完一回合,一个小而快的模型判断条件是否成立,不成立就继续下一回合。Codex的Goal mode做的也是同一件事:给定一个持久目标,Codex就朝着它一轮轮干下去,几小时甚至几天都不用人盯。


subagents也是。Claude Code的子智能体跑在各自独立的上下文窗口里,用于隔离上下文、约束工具、复用配置、控制成本;Codex则靠并行的专用智能体(specialized agents)运行subagent工作流,再汇总结果。更微妙的是,连名字都对上了:Codex给侧边提问命令加的/btw别名,直接与Claude Code撞名;技能系统那边,两者都采用了Anthropic发起的SKILL.md格式。


把两家的文档细细对比,你会发现:这不是谁照搬谁的故事,而是AI编程智能体这个产品本身就在收敛成一个固定形态。长任务、子智能体、上下文压缩、权限沙箱、工作区隔离、插件和技能生态——无论谁做,最后都可能会长成这个样子。

Dreaming这一项更典型。Anthropic给Claude Managed Agents做了个叫dreaming的机制,能回看历史会话、找规律、自我改进;OpenAI六月初也给ChatGPT上了同名的dreaming记忆系统。


这两个dreaming并非同一事物:Anthropic的Dreaming长在托管智能体平台,不是Claude Code命令行里人人能敲的命令;OpenAI的Dreaming则长在ChatGPT的记忆系统里,也不是Codex的编程能力。真正值得注意的是:AI Agent的产品语言、能力模块和接口形式,正在越来越快地向同一套范式靠拢。这意味着功能清单本身已经不再是壁垒,真正的差距从“有没有这个功能”升级到了“这个功能到底做成什么样”。

先发抢热度,赢到最后却看可靠性

在AI这个快速迭代的领域,先发到底还值不值钱?

据WIRED报道,2025年9月,Codex的使用量只有Claude Code的5%。到2026年1月,这个数字蹿到了接近40%——追赶速度很快。用户数也在拉近:OpenAI在6月2日称,Codex周活跃用户已超过500万,较2月桌面版上线时增长约6倍。Anthropic不单独公布Claude Code的周活,第三方估算其5月在200万量级。两者口径不完全对齐:Codex这500万中非开发者已占两成,是把“编程工具”摊成“办公平台”后的数字。

在更纯粹的开发者侧,Claude Code仍占上风:过去30天npm下载量约4630万次,是Codex命令行版(约1400万次)的3倍多。论“每周多少人打开”,Codex已经反超;论“开发者用得有多重”,Claude Code仍领先。

值得Anthropic警惕的,是一些开发者的“倒戈”。WIRED援引Notion联合创始人Simon Last的说法,他和核心工程师在GPT-5.2前后转向了Codex,理由是可靠性。他说Claude Code会对他撒谎,“说自己在干活,其实根本没动”。去年10月,OpenClaw之父Peter Steinberger公开宣布整套工具都用Codex搭成,四个月后他本人也加入了OpenAI。


当先发红利一天天被摊薄,真正的胜负手早已不在“谁先做出来”。差异化窗口正在关闭,双方的功能清单一旦趋同,较量的战场就变成了这些功能的体验上。

差异化窗口正在关闭

早期比的是谁更会写代码、改bug、读代码仓库。现在比的是一整套工程环境:记忆、计划、沙箱、工具调用、子智能体、后台任务、远程控制、长期目标。同一个功能,谁的响应更快、长任务完成率更高、自动压缩更干净、权限更安全、成本更低。

双方对AI编程的理解和路数也不一样。Claude Code更像“终端里的自主工程师”,先在命令行里把开发者工作流吃深,再用hooks、子智能体、技能、插件往外长。Codex更像“多端工作台”,把命令行、IDE、桌面App、移动端远程控制和云端任务揉成一体。虽然打法不同,两者的目标却撞在了一起:都不甘心只当IDE里的一个插件,都想成为开发者每天打开的第一个入口,成为个人和企业的操作系统。

Elie甩出那张表,本想给两家分个高下,结果反而揭开了另一个事实:AI编程智能体的差异化窗口正在迅速关闭。双方越追越紧,也越长越像。真正的竞争,才刚刚开始。