首页 > 教程攻略 > ai资讯 >OpenAI发布GPT-5.6系列大语言模型，挑战Claude Mythos 5

OpenAI发布GPT-5.6系列大语言模型，挑战Claude Mythos 5

来源：互联网时间：2026-06-28 08:01:04

OpenAI正式发布GPT-5.6系列，编程能力直指Claude Mythos 5

就在今天，OpenAI正式推出了GPT-5.6系列大语言模型。这一代产品最吸引人的地方，莫过于在特定编程任务上，OpenAI宣称其性能已经超越了Anthropic的Claude Mythos 5。消息一出，整个技术圈都在关注：GPT系列的迭代速度，是真的快到要改写行业格局了吗？

新系列共包含三款模型：高端旗舰版Sol、中端版Terra以及入门版Luna。相比上一代GPT-5.5，三款模型都增加了两种全新的运行模式：其一是“max”模式，通过延长模型处理任务的时间来提升推理质量——简单说，就是让模型多想一会儿；其二是“ultra”模式，能够同时调度多个子智能体并行处理任务，相当于给模型开了个多线程翻跟斗。这两种模式，直接决定了后续性能指标的差距。

Sol被OpenAI定位为迄今为止能力最强的大语言模型。在涵盖89项复杂编程任务的主流AI基准测试TerminalBench-2.1中，Sol拿下了88.8%的成绩；一旦开启“ultra”模式，得分直接飙升到91.9%，超过了Anthropic旗舰模型Claude Mythos 5的88%。这个跨越，虽然百分点上不算巨大，但在高端基准测试中，每1%的突破都意味着底层能力的质变。

在网络安全研究基准测试ExploitBench上，Sol的表现与Anthropic此前发布的Mythos Preview不相上下。值得一提的是，Mythos Preview自今年4月亮相以来，已经识别出超过10,000个高危及严重级别的软件漏洞——这背后是实打实的攻防积累。Sol能在这个领域追平对手，说明其安全分析能力已经具备了相当的实战价值。

效率方面，OpenAI用Sol测试了今年4月发布的科学数据分析任务集GeneBench v1。结果显示，Sol在消耗更少Token的情况下，达到了前代旗舰模型的同等性能水平。这意味着，同样一笔推理预算，现在能处理更多任务，或者同样任务能做得更精细。

安全防护是这一代模型的重头戏。Sol内置了专门的安全机制，防止模型被用于开发黑客攻击活动等恶意用途。如果防线被突破，有害内容尚未到达用户之前，系统会由一个专用的大型推理模型对输出进行二次过滤——相当于双保险。此外，OpenAI还动用了约70万A100等效GPU小时的算力进行大规模红队测试，专门排查可被批量利用的越狱漏洞，并把测试结果直接用于强化GPT-5.6系列的整体安全性。从投入和部署来看，OpenAI在安全上的决心确实比以往更坚决。

定价方面，Sol的价格为每百万输入Token 5美元、每百万输出Token 30美元；Terra价格约为Sol的一半；Luna则在此基础上再降低约80%。这个价位在整个大模型市场里并不算激进，但考虑到性能级别的差异，入门用户选择Luna完成轻量任务，性价比可能相当可观。

值得注意的是，基于美国政府的要求，GPT-5.6系列目前仅向“少数可信合作伙伴”开放。OpenAI计划在数周内将其推向大众市场。此外，Sol还将支持Cerebras Systems旗下的WSE-3晶圆级AI芯片，为特定的硬件生态留出了接口。关于这代模型能不能真正改写编程任务的效率天花板，接下来的实际应用才是最好的检验。

Q&A

Q1：GPT-5.6系列包含哪些模型，各自有什么区别？

A：GPT-5.6系列共包含三款模型：高端旗舰版Sol、中端版Terra和入门版Luna。Sol是OpenAI目前能力最强的大语言模型，定价最高；Terra价格约为Sol的一半；Luna价格再低约80%。三款模型在性能与成本之间各有侧重，用户可根据实际需求选择。

Q2：GPT-5.6的“ultra”模式是什么，有什么作用？

A：“ultra”模式是GPT-5.6新增的一种运行设置，能够同时调度多个子智能体并行处理任务。以Sol为例，在标准模式下其TerminalBench-2.1得分为88.8%，开启“ultra”模式后提升至91.9%，超越Claude Mythos 5的88%。该模式适合对输出质量要求更高的复杂任务场景。

Q3：OpenAI是如何保障GPT-5.6系列安全性的？

A：GPT-5.6系列在安全方面采取了多重措施：Sol内置了防恶意利用的安全机制，若有害内容突破防线，系统会在响应到达用户前由专用推理模型进行二次过滤。此外，OpenAI还动用约70万A100等效GPU小时进行大规模红队测试，专门排查可批量生成恶意提示词的越狱漏洞，并将测试结果用于强化模型安全性。

OpenAI发布GPT-5.6系列大语言模型，挑战Claude Mythos 5

OpenAI正式发布GPT-5.6系列，编程能力直指Claude Mythos 5

Q&A

Q1：GPT-5.6系列包含哪些模型，各自有什么区别？

Q2：GPT-5.6的“ultra”模式是什么，有什么作用？

Q3：OpenAI是如何保障GPT-5.6系列安全性的？

相关阅读

相关下载