首页 > 教程攻略 > ai资讯 >尴尬了！OpenAI刚派GPT-5.5-Cyber修补地球，Codex却爆出致命bug

尴尬了！OpenAI刚派GPT-5.5-Cyber修补地球，Codex却爆出致命bug

来源：互联网时间：2026-06-24 12:48:37

今天，OpenAI祭出了一记重拳：满血版的GPT-5.5-Cyber，号称要给全世界的开源代码修漏洞。但话音未落，自家的Codex就被扒出了一个堪称“史诗级”的bug——一年狂写640TB数据，足以把一块消费级SSD直接写废。这出冰与火之歌，上演得真叫一个猝不及防。

先说正事儿。刚刚，OpenAI正式发布了「满血版」GPT-5.5-Cyber，这是迄今为止最强大的网络安全专用模型，专为经授权的高级防御任务量身定制。在权威的CyberGym基准测试中，它以85.6%的高分强势击败了Mythos 5，实力不容小觑。

它的核心能力覆盖了四个关键环节：追踪漏洞代码、验证安全隐患、生成补丁，并为人工审查提供证据。同一天，Codex Security插件也同步首发——不仅能修复现有系统中的漏洞，还能自动防止新漏洞流入生产环境。

然而，几乎就在同一时间，Codex被曝出了一个让开发者们心头一紧的「史诗级」漏洞。不少开发者反馈，Codex在执行流式任务和长时间运行时，会以极高的频率向本地SQLite日志疯狂写入数据。一年预估写入量高达640TB——这意味着，用不了一年，一块消费级SSD就会被彻底写废。

一边是「修补地球」的安全神话，一边是「烧穿硬盘」的致命bug——现实版的冰与火之歌，就这么同框上演了。

「满血」GPT-5.5-Cyber登场

实话实说，OpenAI这次确实下了血本。它一口气甩出了网安计划Daybreak（破晓）的三大核心战略，核心叙事只有一句话：AI已经改变了网络安全的「物理定律」。

这次发布的绝对主角，是GPT-5.5-Cyber的完整版。这是OpenAI迄今最强的「网络安全专用模型」，专门为「经过验证的防御者」准备了最强网安工具。在CyberGym基准上，它拿到了85.6%——单模型最高分。作为对比，普通版GPT-5.5是81.8%，而Claude Opus 4.7则停在73.1%。

再来看另外两个硬核基准：在考核「能不能把漏洞变成真实攻击代码」的ExploitGym上，Cyber版39.5%对普通版25.95%；在考核长链条漏洞挖掘的SEC-bench Pro上，Cyber版69.8%对普通版63.1%。三个基准，满血Cyber版全面碾压GPT-5.5。

Codex塞进「AI安全工程师」

如果说GPT-5.5-Cyber是矛，那Codex Security就是递到每个开发者手边的盾。OpenAI更新了Codex Security插件，直接把它焊进了Codex的工作流里——开箱即用的漏洞扫描、威胁建模、攻击路径追踪、补丁自动生成，一条龙服务。

它的逻辑简单又粗暴：在每个程序员身边，塞一个安全工程师。自今年3月研究预览上线以来，Codex Security已经扫描了超过3000万次提交，覆盖3万多个代码仓库。其中，人工复核确认修复的发现超过7万个，自动判定修复的超过50万个。这就是当下「补漏洞」必须达到的规模——以前是人海战术，现在是机器速度。

修补地球，成了KPI

OpenAI还发起了一个听起来就很燃的计划——Patch the Planet（修补地球）。为什么这件事重要？因为开源世界的真相，残酷得有点反直觉。被广泛使用的开源项目里，94%的项目，一年内90%以上的新增代码，靠的是不到10个开发者。撑起半个互联网的代码，背后常常只有几个人在熬夜。

AI让「找漏洞」变得越来越快，可这反而成了维护者的灾难——成千上万份报告砸过来，一大半还是低质量的误报。所以「修补地球」的核心，恰恰是专业人工：研究员先去重、先验证，把干净的补丁送到维护者面前，而不是把噪声一股脑倒给他们。

首批30多个开源项目已承诺加入，包括cURL、Go、Python、Sigstore、pyca/cryptography等。一个五天冲刺就在19个项目里浮现出数百个问题、合并了数十个补丁。

除此之外，OpenAI宣布启动Daybreak（破晓）网络安全合作伙伴计划。它把自己最强的模型能力，通过Cisco、CrowdStrike、Palo Alto Networks、Cloudflare等近30家安全巨头的产品，输送到千千万万家组织里。在政府层面，OpenAI已经和美、英、欧盟的ENISA等机构，建立了「可信网络安全访问」合作。

简言之，OpenAI不只是要做一个模型——它要做全球网络安全的底层操作系统。这盘棋下得很大，姿态也摆得极高。「破晓」这个名字本身就在暗示：黎明已至，防御者将在攻击者动手之前，抢先完成修复。

听上去，一切都那么完美。直到网友们打开了自己的硬盘监控——

「高强度使用Codex的宝子们注意一下，你的磁盘可能正在遭受核打击」。

Codex狂写日志，一年烧穿一块SSD

事情是这样的，有GitHub开发者发现：Codex在流式传输和自动化长任务时，会以约5MB/s（实测峰值甚至到16MB/s）的恐怖速度，疯狂往本地一个叫~/.codex/logs_2.sqlite的SQLite日志文件里写TRACE日志。

5MB/s是什么概念？换算一下，一年大概要写640TB。

而一块普通消费级SSD的标称写入寿命（TBW）大约只有600TB。也就是说，要不了一年，光是Codex在后台默默写的这些日志，就能把整块固态硬盘的寿命彻底榨干。

最细思极恐的地方在于：这一切是「静默」发生的。一位GitHub用户1996fanrui实测，自己机器开机运行21天，主SSD就被写进去了约37TB数据。一查，罪魁祸首正是Codex的SQLite日志。可打开文件管理器一看，这文件大小却平平无奇——因为它在疯狂地「写入再删除、写入再删除」，每分钟上万次插入与清理，文件不大，但实际砸到闪存上的写入量，远超人们肉眼能看到的。

实际上，这个相关问题最早在今年4月就有人提了issue（#17320），之后一路有人补刀——#24275、#22444，再到6月14日那个直接捅破天的#28224。

OpenAI最近的更新日志里确实碰了碰SQLite的稳定性，可对「写入速率」这个核心问题，一直都没修。issue还大大地开着。

尴尬了！OpenAI刚派GPT-5.5-Cyber修补地球，Codex却爆出致命bug

「满血」GPT-5.5-Cyber登场

Codex塞进「AI安全工程师」

修补地球，成了KPI

Codex狂写日志，一年烧穿一块SSD

最新回复：已修复

相关阅读

相关下载