首页 > 教程攻略 > 热点新闻 >Anthropic发布Claude Fable 5模型,以独特安全护栏向公众开放强大AI能力

Anthropic发布Claude Fable 5模型,以独特安全护栏向公众开放强大AI能力

来源:互联网 时间:2026-06-10 21:20:00

经过近两个月的等待,备受关注的Anthropic Mythos级模型终于正式向公众开放。此次发布的核心并非完全“不设限”的版本,而是一个名为Claude Fable 5、配备了全新安全机制的模型。对于广大开发者和企业用户而言,这意味着他们现在能够接触到迄今为止能力最强的Claude模型,但其使用方式被设计得更为安全可控。

Anthropic发布Claude Fable 5模型,以独特安全护栏向公众开放强大AI能力

Anthropic此次实际上发布了两个模型:面向所有用户的Claude Fable 5,以及仅提供给Project Glasswing网络安全合作伙伴的Claude Mythos 5。两者基于相同的底层模型,关键区别在于安全护栏的设置。Fable 5可以被理解为“带护栏的Mythos”,它通过一套创新的机制,试图在释放强大能力与防范潜在风险之间找到平衡。

安全机制:以“降级”替代“拒绝”

与多数AI模型通过直接拒绝高风险请求来保障安全不同,Fable 5采用了独特的“降级”策略。模型背后挂载了一组独立的分类器,当检测到用户的请求涉及网络攻击、生物化学武器或模型蒸馏这三个高风险领域时,系统不会让Fable 5直接回答,而是

悄悄将请求转交给能力稍逊的Opus 4.8模型来处理

,并告知用户发生了降级。Anthropic声称,超过95%的对话不会触发此降级机制。

这套设计的思路是将“安全”与“能力”拆解。用户支付了使用Mythos级别能力的费用,但在最危险的领域,实际是由Opus模型提供服务。官方表示,降级到Opus 4.8的体验优于直接被拒绝。为确保护栏可靠性,Anthropic进行了超过一千小时的外部红队测试,目前尚未发现通用的越狱方法。不过,官方也承认,当前分类器设置偏严,可能导致正常的研究或安全工作请求被误判降级,他们承诺后续将优化以减少误报。

模型能力与潜在风险

那么,Fable 5究竟强大到何种程度,以至于需要如此严密的安全措施?基准测试显示其多项指标领先。一个突出的案例来自支付公司Stripe,他们利用Fable 5在一天内完成了对一个五千万行Ruby代码库的全库迁移,而这项工作原本需要一个团队手工操作两个多月。在编程效率上,Fable 5也表现出色。

其能力的另一面即是风险。例如,Anthropic内部的蛋白质设计专家使用Mythos 5将部分药物设计环节加速了约十倍。更令人瞩目的是,在一项基因组学研究中,Mythos 5在几乎完全自主的状态下连续工作一周多,训练出的一个机器学习模型,其表现超过了发表在《科学》期刊上的同类模型,而模型体量仅为后者的百分之一。正是这种既能加速科研又能潜在用于危险设计的能力,使得生物化学领域成为重点防护对象。

定价、可用性与数据政策

在价格方面,Fable 5和Mythos 5的API定价为每百万输入Token 10美元,输出50美元。相比之前的Mythos Preview版本价格下降了约六成,但仍是Opus 4.8价格的两倍,也高于OpenAI的GPT-5.5模型。这使其成为

迄今最强也是最贵的Claude模型之一

在可用性上,从发布日至6月22日,Pro、Max、Team和企业版订阅用户可以免费使用Fable 5。6月23日后,继续使用需额外购买额度。Anthropic表示,待产能跟上后,会将Fable 5重新纳入订阅标配,但未给出具体时间表。API和企业客户则不受此限。

此次发布伴随一项重要的政策变化:从Fable 5开始,所有Mythos级模型的流量将被强制保留30天,覆盖第一方和第三方平台。Anthropic承诺不将这些数据用于模型训练,仅用于安全监控,如识别新型越狱攻击,并会记录每一次人工访问,在30天后基本删除所有数据。这一变化意味着,使用最强模型的代价除了更高的费用,还包括数据在Anthropic服务器上更长的留存期。

总体来看,Claude Fable 5的发布标志着Anthropic在如何负责任地向公众开放前沿AI能力方面探索了一条新路径。它通过分类器切割能力、用降级代替拒绝、并以30天数据留存作为监控兜底,试图在能力释放与风险控制之间取得平衡。尽管这套机制存在误伤、成本高昂和数据隐私方面的考量,但它为其他AI实验室面临类似困境时提供了一个可参考的解决方案。这道安全护栏的最终强度,将由所有用户共同检验。