Anthropic道歉了，但“安全”这门生意还没停

来源：互联网时间：2026-06-12 14:30:09

6月11日，Anthropic道歉了。但这次道歉跟模型翻车无关——刚上线的Claude Fable 5玩了个小把戏：一旦识别到你在用它搞前沿模型开发，后台就直接把请求悄悄转给更弱的Opus 4.8，整个过程静默进行。

被抓包之后，Anthropic的回应堪称奇葩：以后降智会提前通知你。

网友直接扎心回怼：“那这套操作，以后动手之前得先打个招呼呗？”

问题的核心其实根本不是模型有没有变，而是Anthropic口中的“安全”，说到底就是一门生意。

算法的立场，永远跟着金钱走。

竞业防守，披上安全外衣

事情要从Fable 5上线时说起。Anthropic给这款模型配了个“智能安全分类器”，官方话术是：检测到高危请求，自动降级，保护用户。

那什么叫高危？Anthropic自己交了底：“防止外国对手利用模型加速研发，保护自身领先优势。”

用户哪需要你保护？免责协议里的条款已经够用了。Anthropic真正想说的是：你用Claude搞AI研究，就是动它们的蛋糕。安全只是包装，本质是竞业防守。说白了，都是刀法。

更绝的是，这套防守机制藏得很深。不过Anthropic在道歉声明里倒是说了句大实话：“不可见的安全限制可以更精准地针对特定目标，使我们能够快速发布，且误报率极低。”

AI研究者就是那个被精准瞄准的对象。

现在被迫改成“可见”，纯粹是因为翻车了。它们甚至提前铺好后路：可见之后“不可避免地会产生更多误报”。意思是，普通用户的体验得跟着受牵连。

这套规则从来就不是中立的——它只保护金主。

造势、变&现、收割三部曲

Anthropic这套玩法，比大模型本身算得都精。

6月10日，它们先丢出一篇安全研究：训练了一个模型，能在数小时内根据安全补丁反向构建漏洞利用代码。原本黑客要熬上几天甚至几周才能武器化的N-day漏洞，现在被压缩到小时级别。研究本身确实硬核，但选在Fable 5上线同一天发出来，味道就变了——一边证明AI很不安全，一边兜售“兜底方案”。

“传奇模型”Fable 5定价$10输入/$50输出，比Opus 4.8贵出一截，安全分类器成了核心溢价点。资本市场更是配合：Anthropic估值9650亿美元，计划10月IPO，高盛、摩根大通联合承销。市场买的不是模型参数，而是“最安全AI公司”的人设。

研究放大焦虑，产品收割溢价，资本变&现——三件事顺着利益走，闭环严丝合缝。唯一的问题是，这次闭环漏风了：

急着设限竞争对手，忘了社区里有人能把它测出来。

OpenAI卖工具，Anthropic卖焦虑

对比OpenAI，路数完全不同。

OpenAI也在秘密提交IPO，估值逼近万亿，讲的是“超级应用”：ChatGPT周活9亿，打通Visa做生态。逻辑很直白——给工具，赚流量。贪婪，但坦荡。

Anthropic不卷规模，卷的是不可替代性。全行业焦虑安全，它就扮成“唯一负责任的大人”。它的金主是政府和巨头，这帮人最怕出事，也最愿意为“不出事”砸钱。

所以Anthropic必须让AI永远处于“危险但可控”的薛定谔状态。太安全，分类器卖不动；太危险，客户吓跑了。最好的解决方式？把定义“危险”的权力攥在自己手里。

降智事件只是把这套逻辑玩脱了：“危险”的边界被推到了“用Claude做AI研发”这个点上。你的研究有没有危害不重要，威胁到我的领先地位才是原罪。

AI哪有什么价值观，不过是把老板的商业算盘写成了代码。

道歉，不过是生意的售后

道歉之后会怎样？从悄悄降智，变成降智前吱一声。

网友看得门儿清：“你真信它以后不会偷偷降输出质量？”

信任这东西，破了就是破了。更何况商业底色一点没变：研究还在放大焦虑，产品还在收割溢价。

《华尔街日报》爆料，OpenAI正在考虑大幅降价，试图从Anthropic手里抢客户。价格战不稀奇，但这件事戳破了一个隐藏的真相：隐性降级的是AI研究者，砸的是极客圈的口碑。而B端客户买Anthropic，买的不是参数，而是“行业里最懂安全”的人设。人设一旦在核心开发者群体里裂开，那些为“安全溢价”签单的政企客户，凭什么继续相信你是“最安全的那个”？

9650亿估值里，到底几分是硬实力，几分是表演？

Anthropic的代码很诚实。安全分类器永远在护盘，研究负责放大焦虑，产品负责收割溢价，IPO负责变&现。这次道歉，不过是给系统打了个补丁：把“暗中降智”变成了“明着降智”。

安全策略如果真管用，Anthropic就不必年年发论文来证明补丁能被捅穿。分类器如果真中立，搞AI研发就不会被列为高危。

答案早写在商业逻辑里了。