Claude Fable 5四日惊魂
从万众瞩目的AI封神时刻,到美国政府一纸禁令强制下线——这个模型的名字里有个5,但只活了不到5天。荒诞吗?确实挺荒诞的。
先把时间线拉回2026年6月9日。那天,Anthropic终于向公众发布了它最强大的模型:Claude Fable 5。消息一出,开发者社群直接沸腾了。评测帖子在社交媒体上刷屏,有人说它“碾压一切”,有人说它“改写了AI的上限”。要知道,Anthropic的Mythos系列此前一直是个神秘的“内测俱乐部”,只有五六家机构能摸到它。如今,这道门缝终于对普通人敞开了一点。
然后,四天后,这扇门被人从外面焊死了。
6月12日,美国商务部长霍华德·卢特尼克(Howard Lutnick)给Anthropic的CEO Dario Amodei寄了一封信,核心就一句话:以“国家安全”为由,禁止Fable 5和Mythos 5向任何外国公民开放访问——无论你在美国境内还是境外,甚至包括Anthropic自己的外籍员工。指令下达时间:美东时间下午5点21分。当天晚上,Fable 5在全球范围内下线。
96个小时。四天。一段从高光到猝死的极速坠落。

第一天:神话降临
Fable这个词来自拉丁语fabula,意思是“被讲述的故事”,和希腊语的mythos同根。Anthropic在命名上确实花了不少心思:Mythos系列是为少数精英保留的神话,Fable则是让普通大众也能听到那个故事。
6月9日发布的Claude Fable 5,是Mythos模型的首个公开版本。据Anthropic自己说,它在软件工程、知识工作和视觉方面都表现卓越,当然,安全限制也相当严格。同时发布的还有它的双胞胎兄弟:Claude Mythos 5。两者用了相同的底层模型,但Mythos 5移除了网络安全领域的安全过滤层,仅提供给经过严格审查的网络防御者和关键基础设施运营商。Anthropic称它是“全球最强的网络安全模型”。
通俗点理解:Mythos 5是上了膛的真枪,Fable 5则是同款枪,但出厂自带保险。

定价方面,Fable 5的能力在Anthropic公开发布的模型中首屈一指,价格却只有Claude Mythos Preview的一半以下。而且,到6月22日,它会在Pro、Max、Team和Enterprise等付费套餐中免费提供。
科技圈的反应可想而知——赞美如潮水般涌来。沃顿商学院副教授Ethan Mollick在博客里写道,Fable 5“在我用过的所有公开模型中,以相当大的差距超越了其他所有模型”。前OpenAI联合创始人、特斯拉AI总监Andrej Karpathy(他上个月刚加入Anthropic)也在社交媒体上称,这是一次“超级令人兴奋的发布”,是“值得大版本号升级的跨越式进步”。
这一天,Anthropic的Mythos神话,似乎真的成真了。
第二天:“秘密降智”事件爆发
好景不长。发布仅仅24小时后,一场风暴在AI社群悄然酝酿。
导火索,是一份319页的安全说明书——System Card。
这个细节,Anthropic并没有主动披露:Fable 5会在检测到与前沿AI开发相关的请求时,悄悄降低回答的质量。具体来说,就是当用户问及训练大型模型所需的基础设施搭建等事宜时,模型仍然会给出回应,但会采取一些“干预措施来限制Claude的有效性”,而且不告诉用户它在这么做。这和它屏蔽网络安全或生物学查询时的操作完全不同——那种情况,模型会直接把你重定向到功能较弱的Claude Opus 4.8,并且会有明确的说明。
换句话说:你问它AI训练相关的问题,它其实回答了你,但给你的答案打了折扣,而且不告诉你它打了折扣。这种操作,被迅速冠以一个传播速度极快的名字:“暗中使坏”(Secret Sabotage)。
美国创新基金会高级研究员、前白宫科技政策办公室顾问Dean Ball给这一事件定了性,并写道,这一政策“极大地、深刻地提升了‘AI安全一直是实验室垄断行为的借口’这一论点的说服力”。Fast AI非营利研究机构负责人Jeremy Howard则指出了其中的不对称性:Anthropic给自己的研究人员保留了完整的Fable 5能力,却在对外部研究者的访问上设了枷锁。“他们已经表明了态度:凡是想要效仿的,都会被他们破坏,”Howard写道。
批评来自四面八方,而且立场之复杂令人惊叹——平时攻击Anthropic“太保守”的开源倡导者,和平时为其安全路线辩护的AI安全研究者,这一次居然站在了同一阵线。
刚加入Anthropic一个月的Andrej Karpathy,措辞显得格外谨慎:模型“仍然有一些人会遇到的奇怪之处”,安全过滤器“配置得有点过于敏感”,但愿能随时间改善。算是在打圆场,但并没有全力护盘。
Anthropic也很快感受到了压力的分量。一位发言人对《财富》杂志表示:“我们做出了错误的权衡,对于没有取得正确的平衡,我们深表歉意。”随后,隐藏的能力限制被移除。

承认失误、道歉、回滚……这在科技大厂里已算是罕见的姿态了。但麻烦,还只是刚刚开始。
第三天:微软“背刺”,数据留存风波
就在“秘密降智”风波渐渐平息之际,另一颗雷悄悄炸了。
微软以数据保护问题为由,对员工使用Claude Fable 5实施了临时禁令。
这个反转的荒诞感值得细品:微软一边通过GitHub Copilot和Microsoft Foundry向企业客户销售Claude Fable 5,一边却禁止自己的员工碰它——同一个产品,对外卖可以,对内用不行。这在硅谷也算新鲜事了。

问题的核心出在数据留存政策上。Anthropic要求对Mythos系列模型(包括Fable 5)的提示词和输出内容至少保留30天,用于安全监控。这和微软此前与Anthropic签订的企业零数据留存协议直接冲突。更糟的是,如果被Anthropic的安全系统标记,这些内容最长可以被保留两年,用于调查或执法。对一家把“保护客户数据”视为核心承诺的企业来说,员工用Fable 5处理商业机密时,这些数据理论上可以在Anthropic的服务器上存放长达两年——这无疑是一个真实的风险敞口。
这场尴尬揭示了一个更深层的矛盾:在企业AI采购中,模型能力、安全架构和数据治理,已经无法再被分开考量了。
与此同时,安全社区在发布后最初几天也开始记录另一个问题:Fable 5对许多合法的红队测试(Red Team)和学术安全工作流程也触发了拒绝,而这些请求和Opus 4.8在标准策略下会处理的内容几乎一模一样。Anthropic在给普通用户关上漏洞的同时,也把正规军堵在了门外。
到第三天结束时,Fable 5的处境已经相当微妙:“秘密降智”虽然撤回了,但数据政策引发的企业端信任裂缝还没有修复,安全过滤的误伤率仍被研究人员抱怨。这个模型像一个刚刚公演的演员,首演就被人挑出了三处穿帮。
第四天:美国政府出手,神话强制落幕
6月12日,周五下午。美国商务部长卢特尼克的那封信,像一记重锤砸了下来。
信的内容很简单:Mythos 5和Fable 5将受到出口管制,范围覆盖美国境外的任何地点,以及境内的所有外国公民。Anthropic当晚收到指令的时间是美东时间下午5点21分。信中并没有提供具体的国家安全关切细节。
据Axios报道,这名行政官员表示,商务部是在另一家公司声称成功“越狱”Mythos后决定采取行动的。这起“越狱”事件,让特朗普政府对潜在的国家安全风险产生了警觉。所谓“越狱”,就是通过特殊提示绕过模型的安全限制,让它吐出本该被过滤的内容。如果有人能绕过Fable 5的安全层,理论上就能访问到底层Mythos模型的完整网络安全能力——那可是Anthropic自称“全球最强网络安全AI”的东西。
Anthropic随即作出回应,语气里藏着明显的委屈:我们审查了这一特定技术的演示,其被用于识别少量此前已知的微小漏洞。这些漏洞看起来都相对简单,其他公开可用的模型也能在不越狱的情况下发现它们。换句话说,Anthropic的意思是:你说的这个“越狱”,用其他普通模型也能复现,凭什么单独封杀我?
Anthropic还进一步指出,政府援引的越狱方式只能在单一的特定情形下解锁Mythos的部分网络安全能力,远非能够全面绕过所有防护的通用型越狱方法。而且,同样的越狱手段也能用于包括OpenAI的GPT-5.5在内的其他公开可用模型,但它们并没有受到类似的出口管制。“我们不同意,发现一个局部的潜在越狱方法,应该成为召回一款已向数亿人部署的商业模型的理由。”Anthropic在博客中写道。

然而,争论在命令面前毫无意义。Anthropic选择全面关闭Fable 5和Mythos 5的访问权限。原因是若要选择性合规,就必须屏蔽大量用户——其中包括Anthropic自己的外籍员工。深夜,全球用户打开Claude时发现,Fable 5已经从模型列表里彻底消失了。
幕后:这不只是一次技术事故
如果你以为这只是一场普通的“新模型发布翻车”,那可能就错过了更深层的剧本。这场风波的背后,是Anthropic与特朗普政府之间一段持续数月的对抗关系。2026年2月,五角大楼与Anthropic的谈判破裂:Anthropic拒绝允许Claude被用于致命自主武器或大规模平民监控,并为此付出了代价——被贴上“供应链风险”的标签。历史上,这个标签通常只留给外国竞争对手,并要求国防承包商在合作时承诺不使用Anthropic的Claude模型。
此后,Anthropic对特朗普政府提起诉讼以求推翻这一封禁,诉讼至今仍未结束。时间线至此变得耐人寻味:合同谈判破裂在2月,黑名单来了;Anthropic起诉政府,法院暂时阻止了黑名单执行;Fable 5在6月上线,三天后,出口管制指令到达。而出口管制指令发出的时间,恰好就在Anthropic与政府在法庭上交锋的同一周。
更具戏剧性的是Anthropic那份透明度的反噬。Anthropic在发布前公开承认,任何模型的完美越狱抵抗都是不可能实现的——这是一种出于善意的透明表态。但政府似乎正是以这一承认为框架,为其担忧找到了依据。如果坦诚自己的局限会招来监管行动,而保持不透明则不会,那么行业自然会得出相应结论。最终结果是,公众能获得的AI能力和风险信息只会越来越少——这与安全倡导者们多年来的追求恰恰相反。
说白了:你越诚实,越可能被人抓住把柄。
结语:Fable的故事,讲了个寂寞
Fable,那个来自拉丁语“被讲述的故事”。
这四天里,Fable 5确实被讲述了。只是没人料到,它自己才是这个故事里最短命的主角。96小时内,它完成了一次令人叹为观止的“成就解锁”:发布日万众瞩目,被誉为AI史上最强公开模型;第二天被曝“秘密降智”,Anthropic连夜道歉撤回;第三天微软宣布内部禁用,数据政策掀起企业端信任危机;第四天,美国政府一纸令下,全球强制下线。
这是一个在封神和封禁之间,只隔了四天的故事。
Anthropic目前正在争取尽快恢复访问。公司表示认为存在误解,并对Fable 5的安全防护架构保持信心,同时指出没有任何测试者发现能够广泛绕过模型防护的通用越狱方法。但“Fable 5重新上线”的那个故事,暂时还没有被讲述。
更深层的问题也悬而未决:当一个公司将自己最强大的产品公开发布,政府可以在72小时内以“国家安全”为由将其全球下线——这条权力边界,今后每一家AI公司都必须纳入自己的发布风险模型。未来的AI发布,不只是技术问题,也是地缘整治问题。
而Fable这个词的另一层含义,也不应被遗忘:它还可以指“寓言”——一个带有道德教训的虚构故事。这一次的教训是什么,就留给读者自己去判断了。