Codex兼容国产开源模型,实测DeepSeek接入:门槛还是太高
来源:互联网
时间:2026-06-23 15:06:48
# OpenAI的“半开放”策略:Codex与第三方模型的真实距离
6月17日,OpenAI Codex团队负责人Tibo在X上发了一条推文,直接点明了Codex App、CLI和SDK现在可以接任何开源模型——不再局限于OpenAI自家的模型了。他还贴出了官方配置文档,指向OSS模式和本地provider的说明。说实话,这消息来得有点突然。长期以来OpenAI给人的印象一直是偏封闭的,这次突然在模型供应商上开了口子,确实不太一样。
关键在于,Codex不是个普通的工具。它本质上是一个完整的工作台,能读文件、写文件、调shell、抓网页、执行命令,还能根据工具返回的结果继续推理判断,最后输出可交付的成果。说白了,在Codex里,模型不光要能说会道,更重要的是得真能干活。
过去很多人吐槽OpenAI封闭,不光是模型不开源,更核心的原因是它的工具、模型和工作流都被包在自家体系里——你可以用,但很难拆开重组。尤其是Codex这种Agent工具,本质上是模型能力、工具调用、上下文管理、权限控制和本地环境的组合。模型越强,工作台越完整,用户就越不容易离开。现在OpenAI给Codex留出了custom model provider入口,至少在姿态上不再只把Codex死死绑在自家模型上。
但OpenAI真的就这么彻底放开了?实际测试下来发现,远没这么简单。
## 填个Key就想用第三方模型?没这么简单
这次最容易误读的地方,其实就是“Codex支持第三方模型”这句话。很多人会想,既然DeepSeek、Qwen、Kimi这些模型都提供API,有些还号称兼容OpenAI API,那把接口地址和API Key填进Codex,是不是就能直接用了?我们一开始也是这么测的。
Codex的官方高级配置文档里确实写到了自定义模型供应商。简单说,一个provider可以定义Codex连接模型的方式,包括接口地址、协议类型、鉴权方式和一些附加请求信息。你可以在配置文件里新增一个模型供应商,再让Codex指向它。
但第一次尝试接入DeepSeek V4 Pro的API,就失败了。
翻看官方技术文档后答案很明显:Codex确实开放了,但只开放了一半,是有条件地开放。文档里写得很清楚,当前自定义供应商公开支持的协议只有Responses API这一种,省略不填时也是默认协议。也就是说,Codex允许你换模型供应商,但当前公开配置路径吃的是Responses API这套协议,模型供应商能不能进来,不光看它有没有API,还要看它能不能给Codex提供它要的Responses形态。
DeepSeek官方API的主入口是Chat Completions,它可以用OpenAI SDK调用,模型也能正常填DeepSeek V4 Pro——对很多聊天应用和普通API调用场景来说这没问题,但Codex不是这么请求的。我们尝试让Codex直连DeepSeek,模型填DeepSeek V4 Pro,鉴权也走DeepSeek的Key,启动之后Codex实际去找的是DeepSeek官方并不存在的Responses接口,结果返回404。
说白了,DeepSeek官方的OpenAI格式入口并没有提供Codex当前要访问的Responses API端点。
同样叫“兼容OpenAI”,里面也分很多层。Chat Completions是一套接口,Responses API是另一套接口。普通聊天、工具调用、流式输出、推理块、函数调用结果回传,在不同协议里结构并不完全一样。这些差别对用户来说都藏在配置后面,但对Codex这种Agent工作台来说,它们会直接决定任务能不能跑起来。
真正的转机来自DeepSeek的另一个入口——Anthropic API兼容端点。DeepSeek官方文档里除了常见的OpenAI格式入口,还提供了Anthropic格式入口,后者更适合承载工具调用、工具返回结果这类Agent场景需要的结构,和Codex的工作方式更接近。最后跑通的路径,不是让Codex直接访问DeepSeek,而是在本机加了一层轻量“翻译器”。Codex仍然按自己熟悉的方式发起任务,这个翻译器再把请求转成DeepSeek能理解的格式,DeepSeek返回后,再翻译回Codex可以继续执行工具的形态。
更直接地说,目前大家期待的DeepSeek、Mimo、Kimi、智谱GLM都没有办法直接拿API Key接入Codex,只能用转接桥,和之前流行的CC Switch方案差不太多。当然,非要尝尝“直接”也不是不行,阿里百炼大模型目前提供了Responses接口,价格嘛,200元/月,有刚需的话可以试试。
## DeepSeek驱动的Codex,体验真的好吗?
跑通配置之后,我们让DeepSeek+Codex去执行一些更接近实际场景的任务,主要是想看看第三方开源模型和Codex结合会不会水土不服。
第一个任务是全网搜索雷科技相关资料,结合官网介绍、文章和特色报道(比如MWC、IFA、AWE等展会报道),做一份商务招商文档,输出成Markdown文件。这个任务看起来像写稿,其实包含好几个Agent能力点:要先找资料,找不到搜索工具时要能换策略;拿到网页后要能提取有用信息;信息不能只堆在一起,还要按招商文档的结构重新组织;最后还要把结果写成本地Markdown文件。
DeepSeek V4 Pro一开始尝试时内置网页搜索工具不可用,网页搜索的能力也不顺畅,但它直接换了一个方式——从本地终端直接抓取雷科技官网的一手页面,包括首页、关于我们、联系我们、历史专题列表、MWC26专题、MWC26凯旋报道、AWE2026专题等。最后生成了一份320行的Markdown文档,内容上整理出了品牌定位、媒体矩阵、用户画像、内容栏目、核心数据、展会报道能力、视频化分发、商务合作模式、合作案例和联系方式。
虽然页面比较粗糙,但确实能用了。
第二个任务更进一步:读取上一步生成的招商文档,再做一份雷科技2026年度招商报告PPT,输出成HTML格式。这一步测试的是连续任务能力。模型需要理解上一步文件里的9个章节,再把它们改造成10页slide,包括封面、关于雷科技、媒体矩阵、内容体系、核心数据、全球展会、视频战略、商务合作、合作案例、联系我们。
最终输出是一个单文件HTML,约790行,接近40KB,里面包含暗色科技风主题、蓝紫强调色、滚动触发动画、右侧圆点导航、键盘上下翻页、响应式布局和打印导出PDF支持。这不是精修设计稿,但已经是一个可打开、可预览、可继续修改的交付物。从完成度看,DeepSeek在这组轻量任务里是能用的——资料整理速度快,长文档组织能力不错,遇到工具不可用时还能尝试绕路,生成Markdown和HTML这类文本型文件比较顺。对于“写一份介绍”“整理一份资料”“根据文档生成展示页”这类任务,它已经可以承担初稿生产。
但体验上,它还不像官方模型那样成熟。Codex+GPT 5.5所有能力都在同一个生态里,模型、工具调用、上下文、视觉能力等都能顺利调用。而DeepSeek在Codex里跑的链路很长,中间还经过了一层转接桥,速度自然是比不上“官配”组合的。
所以在响应速度上,DeepSeek在简单文本和资料整理任务里没有慢到不能用,但确实不如官方模型来得快。尤其进入Codex这种Agent工作流之后,它不是一次性回答完,而是要一边调用工具、等待结果、一边继续推理。链路多了一层本地翻译,工具调用也要来回跑,速度体感自然会慢一些。
消耗上就很有意思了。给DeepSeek账户充了10块钱,跑完这两个任务,中间还夹着几轮聊天和调试,最后余额还剩9.27元。也就是说一整轮轻量实测只花掉了7毛多。DeepSeek真不愧是性价比之王,假如全都是这类型的任务,那确实可以抛弃ChatGPT Plus每月20美元的订阅费了。
## 这波要让智谱和DeepSeek们赢麻?
体验下来,对多数普通用户来说,Codex能不能搞第三方模型,意义其实没那么大。想要简单、丝滑的体验,开通个Plus会员性价比也不低,毕竟它是和ChatGPT打包在一起的。
真正有利的,是那些开源模型。
过去国产和开源模型想进入开发者真实工作流,需要自己做很多产品层能力。一个模型发布API只是第一步,后面还有IDE插件、命令行工具、文件权限、工具调用、项目上下文、任务记忆、错误恢复、协作界面、审阅流程——这些东西不是模型论文能解决的。
Codex这类工具的价值,在于它把工作台先搭好了。它负责和本地文件系统交互、执行命令、展示工具调用、把任务拆成多轮、让模型在上下文里持续工作。第三方模型一旦能接进去,就相当于直接获得了一个成熟Agent容器。这对智谱、DeepSeek、Qwen、Kimi们都是机会。
比如智谱,最近上线的GLM-5.2直接强调1M无损上下文、长程任务能力提升,Coding与长程任务评测达到开源SOTA,在复杂系统工程、深度调试里表现更稳。过去几天,开发者圈对这个模型的评价很高,很多人夸它在代码任务和长程Agent场景里的性能非常强。更有意思的是,智谱的GLM Coding Plan已经开始变成一种稀缺资源——因为太火爆,不少人抢不到。但这其实已经说明国产模型的竞争不再只是发布一个强模型,而是开始围绕Coding Plan、开发工具接入、Agent工作流额度和真实工程体验展开。
当然,智谱并不是没有自己的Agent工具。它也在做类似Codex的图形化Agent工作台,用户可以在里面交给模型代码任务、长程任务和工程任务。问题在于,对模型厂商来说,自建工作台和接入Codex这类成熟工作台并不冲突。自家工具更适合展示完整能力和打磨闭环体验;接入Codex则更像进入一个已经被大量开发者熟悉的工作环境。用户原本就在Codex里写代码、跑命令、读项目、交付文件,如果国产模型能出现在同一个任务流里,被使用和被比较的机会都会变多。
在OpenAI释出消息后,智谱的股价一路飙升,盘中一度大涨超22%,股价突破2000港元大关,市值也站上新高,创下近期新纪录——这已经很能说明问题了。
不过,OpenAI也有自己的考量。Codex开放provider并不意味着OpenAI放弃了控制权。恰恰相反,工作台标准仍然由它定义——Responses API、模型配置、官方推荐模型、工具调用协议、权限机制,这些关键环节仍然围绕OpenAI的体系展开。OpenAI想要的局面,可能是让Codex成为更通用的Agent工作台。官方模型负责最强能力和最佳体验,第三方模型负责扩展场景、降低成本、覆盖更多供应商需求。用户可以有选择,但选择发生在OpenAI定义的工作台里——这比单纯封闭聪明得多。
说到底,Codex开放明显是双赢的局面。对OpenAI来说,它能把Codex往平台方向推,使其在不久的将来有可能成为一家独大的AI工作台;对国产和开源模型来说,它们终于有机会进入一个成熟工作台,而不是只待在自己的Agent里。但目前来说,OpenAI开放得还不够——远远不够。