美国推动AI模型「自愿」审查,Meta为什么不签字?
咱们先说个核心判断:特朗普政府正在推进AI模型审查这件事,最近有了新的进展。话说,有媒体报道称,特朗普政府正敦促Meta将自家前沿AI模型提交给联邦政府进行所谓的“自愿审查”。在众多美国AI巨头中,Meta是目前少数几家还没签署类似协议的玩家。这事儿听起来不像强制审批,但对公司来说,它的影响可不小——它决定了最强模型在公开发布前,怎么接受安全测试;政府到底能提前看到模型哪些本事;一旦模型涉及到网络、生物、化学武器这类国家安全风险,访问权限会不会被要求调整。目前,OpenAI、Anthropic、Google、xAI和Microsoft据说都已经同意跟商务部下属机构合作了,所以Meta的谈判进展自然被外界高度关注。
这次接触的核心,其实是围绕着一个叫美国人工智能标准与创新中心(CAISI)的机构。CAISI属于商务部跟NIST体系,是2025年6月从拜登时期的美国AI安全研究所改组而来的。它的职责变了味,更强调自愿协议、安全测试标准和国家安全风险评估。CAISI官网上写得明白:它准备跟私营AI开发者建立自愿协议,并开展那些可能涉及国家安全风险的非机密评估。
Meta这边,政策团队正在跟商务部讨论协议的具体细节,希望能尽快敲定。商务部呢,就把这事情轻描淡写地描述为CAISI跟AI企业的常规工作。说到底,真正的分歧不是要不要给模型做一次测试,而是签署协议后,Meta未来模型发布是不是就被划拉进了政府固定的评估流程里了。
Meta成了最显眼的观望者
Meta之所以被推到台前,首先是因为美国主要AI实验室正在陆续跟政府建立审查合作。据媒体援引知情人士的消息,OpenAI、Anthropic、Google、xAI和微软都已经同意向CAISI提交模型了,唯独Meta还在犹豫。当然,官方并没有公布完整名单,这个说法得把它当作媒体口径来看待。
前沿模型早就不是以前的聊天机器人和内容生成工具了。那些能力最强的系统,可能帮研究人员发现软件漏洞、自动生成代码、甚至调用外部工具。更让人提心吊胆的是,它们也可能被恶意用户改造成攻击辅助工具。政府想在模型更广泛发布前提前评估的,正是这些能力边界。
Meta最近的新模型计划,也让外界更加关注。据报道,公司4月发布了Muse Spark模型,主打多模态推理和工具使用。虽然相关细节还没完全公开确认,但有风向标意义的是,Meta确实在继续推进新一代模型能力。而政府显然想把这些模型纳入到发布前评估的框架里。
对Meta来说,签协议有好处——能降低跟政府的摩擦,但也可能带来新的发布不确定性。公司需要在审查范围、商业机密保护、访问权限和发布时间上,争取最大的空间。
30天评估窗口不是审批,但会影响发布节奏
白宫6月2日发布的EO 14409,给出了更清晰的制度安排。这份行政令要求相关机构在60天内设计一个自愿框架,允许开发者在广泛发布前,向联邦政府提供覆盖前沿模型最多30天的访问权限,用于安全评估。
行政令里也写得明明白白:这不应被解读为强制许可、预审或审批制度。换句话说,美国政府没有打算把前沿模型发布改成正式牌照制,至少在文本层面,还强调自愿提交和安全评估。
但是,30天窗口足以改变发布前的最后一段流程。对AI公司来说,模型发布越来越像一场压缩到周甚至天的赛跑。延迟发布,影响市场声量、企业客户试用、开发者生态和融资叙事。虽然这不是审批,但只要政府评估带来额外的沟通、修改或访问限制,那发布时间表就变得更难搞了。
目前还不清楚的是,如果政府评估后发现风险,公司是不是必须推迟发布、限制部分用户访问,或者对模型能力进行调整。不同公司的模型会不会按统一标准处理?这个要等到自愿框架大概8月初前进一步落地才能见分晓。
Anthropic事件让自愿更敏感
Anthropic事件是这套机制最现实的压力测试。AP报道说,美国政府曾要求Anthropic阻止外国国民使用Fable 5和Mythos 5模型,结果Anthropic为了合规,直接关闭了所有客户访问。
引发担忧的一个焦点是,Amazon相关报告显示,Mythos在测试中能识别软件漏洞。但AP也注明了,这不代表这款模型已经能利用漏洞发动攻击。Anthropic方面强调,相关能力并非只有他们的模型才有,类似的系统也可能用于防御。
Axios报道称,Amazon报告和漏洞问题加剧了政府担忧。后来,特朗普接受Axios采访时表示,不再认为Anthropic是安全威胁了,双方关系才有所缓和。
这个案例给AI行业留下的问题很直接:如果审查协议名义上是自愿的,一旦政府把模型某项能力判断为国家安全风险,公司到底能不能拒绝限制访问?如果不能拒绝,那所谓的自愿评估在实践中,就接近于发布前的约束了。
Meta谈判卡在政府介入边界
Meta现在的难处在于,左边是狼,右边是虎。不签协议,它就会一直是最显眼的观望者,容易被监管方和竞争对手拿来比较。签了协议,公司又要接受一个尚未完全成型的政府评估流程,未来模型发布反而多了一层不确定性。
如果最终框架主要停留在安全测试、漏洞共享和非机密评估的层面上,AI公司大概率会把它纳入发布前的合规流程。但要是政府评估后能推动暂停发布、限制访问或要求整改,那前沿模型的公开节奏就太难预测了。
这场谈判的影响,不只落在Meta一家身上。OpenAI、Google、Anthropic、xAI、微软和Meta都在加速模型能力竞赛,美国政府试图把最强模型的安全评估提前到公开发布之前。真正尚未写清的,是政府安全判断与公司发布自主权之间的边界。