Anthropic道歉了,但“安全”这门生意还没停
6月11日,Anthropic道歉了。但这次道歉跟模型翻车无关——刚上线的Claude Fable 5玩了个小把戏:一旦识别到你在用它搞前沿模型开发,后台就直接把请求悄悄转给更弱的Opus 4.8,整个过程静默进行。
被抓包之后,Anthropic的回应堪称奇葩:以后降智会提前通知你。
网友直接扎心回怼:“那这套操作,以后动手之前得先打个招呼呗?”
问题的核心其实根本不是模型有没有变,而是Anthropic口中的“安全”,说到底就是一门生意。
算法的立场,永远跟着金钱走。
竞业防守,披上安全外衣
竞业防守,披上安全外衣

事情要从Fable 5上线时说起。Anthropic给这款模型配了个“智能安全分类器”,官方话术是:检测到高危请求,自动降级,保护用户。
那什么叫高危?Anthropic自己交了底:“防止外国对手利用模型加速研发,保护自身领先优势。”
用户哪需要你保护?免责协议里的条款已经够用了。Anthropic真正想说的是:你用Claude搞AI研究,就是动它们的蛋糕。安全只是包装,本质是竞业防守。说白了,都是刀法。
更绝的是,这套防守机制藏得很深。不过Anthropic在道歉声明里倒是说了句大实话:“不可见的安全限制可以更精准地针对特定目标,使我们能够快速发布,且误报率极低。”
AI研究者就是那个被精准瞄准的对象。
现在被迫改成“可见”,纯粹是因为翻车了。它们甚至提前铺好后路:可见之后“不可避免地会产生更多误报”。意思是,普通用户的体验得跟着受牵连。
这套规则从来就不是中立的——它只保护金主。
造势、变&现、收割三部曲
造势、变&现、收割三部曲
Anthropic这套玩法,比大模型本身算得都精。
6月10日,它们先丢出一篇安全研究:训练了一个模型,能在数小时内根据安全补丁反向构建漏洞利用代码。原本黑客要熬上几天甚至几周才能武器化的N-day漏洞,现在被压缩到小时级别。研究本身确实硬核,但选在Fable 5上线同一天发出来,味道就变了——一边证明AI很不安全,一边兜售“兜底方案”。
“传奇模型”Fable 5定价$10输入/$50输出,比Opus 4.8贵出一截,安全分类器成了核心溢价点。资本市场更是配合:Anthropic估值9650亿美元,计划10月IPO,高盛、摩根大通联合承销。市场买的不是模型参数,而是“最安全AI公司”的人设。
研究放大焦虑,产品收割溢价,资本变&现——三件事顺着利益走,闭环严丝合缝。唯一的问题是,这次闭环漏风了:
急着设限竞争对手,忘了社区里有人能把它测出来。
OpenAI卖工具,Anthropic卖焦虑
OpenAI卖工具,Anthropic卖焦虑
对比OpenAI,路数完全不同。
OpenAI也在秘密提交IPO,估值逼近万亿,讲的是“超级应用”:ChatGPT周活9亿,打通Visa做生态。逻辑很直白——给工具,赚流量。贪婪,但坦荡。
Anthropic不卷规模,卷的是不可替代性。全行业焦虑安全,它就扮成“唯一负责任的大人”。它的金主是政府和巨头,这帮人最怕出事,也最愿意为“不出事”砸钱。
所以Anthropic必须让AI永远处于“危险但可控”的薛定谔状态。太安全,分类器卖不动;太危险,客户吓跑了。最好的解决方式?把定义“危险”的权力攥在自己手里。
降智事件只是把这套逻辑玩脱了:“危险”的边界被推到了“用Claude做AI研发”这个点上。你的研究有没有危害不重要,威胁到我的领先地位才是原罪。
AI哪有什么价值观,不过是把老板的商业算盘写成了代码。

道歉,不过是生意的售后
道歉,不过是生意的售后
道歉之后会怎样?从悄悄降智,变成降智前吱一声。
网友看得门儿清:“你真信它以后不会偷偷降输出质量?”
信任这东西,破了就是破了。更何况商业底色一点没变:研究还在放大焦虑,产品还在收割溢价。
《华尔街日报》爆料,OpenAI正在考虑大幅降价,试图从Anthropic手里抢客户。价格战不稀奇,但这件事戳破了一个隐藏的真相:隐性降级的是AI研究者,砸的是极客圈的口碑。而B端客户买Anthropic,买的不是参数,而是“行业里最懂安全”的人设。人设一旦在核心开发者群体里裂开,那些为“安全溢价”签单的政企客户,凭什么继续相信你是“最安全的那个”?
9650亿估值里,到底几分是硬实力,几分是表演?
Anthropic的代码很诚实。安全分类器永远在护盘,研究负责放大焦虑,产品负责收割溢价,IPO负责变&现。这次道歉,不过是给系统打了个补丁:把“暗中降智”变成了“明着降智”。
安全策略如果真管用,Anthropic就不必年年发论文来证明补丁能被捅穿。分类器如果真中立,搞AI研发就不会被列为高危。
答案早写在商业逻辑里了。