谷歌正式对Meta实施Gemini大模型的算力额度使用限制
最近,谷歌对Meta下了一记“算力限制令”——正式对后者使用Gemini大模型的算力额度设限。这事看起来像两家巨头之间的商业摩擦,但往深了看,它狠狠戳中了整个AI行业最敏感的神经:即便手握全球顶级算力基础设施的玩家,照样兜不住市场对算力的疯狂吞噬。算力供给跟不上需求,已经成为AI产业向更高阶迈进的硬伤。

这次冲突的导火索,说到底就是Meta“要得太多了”。早在2026年3月,Meta就向谷歌提交了Gemini大模型的算力使用申请,申请的规模直接超出了谷歌当时能给出的最大额度。谷歌当时就摊牌了:供不上。但问题是,2026年第二季度全球AI应用全面爆发,Gemini API的市场请求量在短短5个月内(3到8月)直接翻倍,谷歌云后台的积压订单量环比也跟着接近翻番。整个行业的开发者和企业客户都在抢那点有限的算力资源,池子就这么大,谁喊得最响、要得最多,谁就先被挤兑——Meta自然首当其冲。
面对算力供不应求的窘境,谷歌从5月17日开始对全部Gemini客户实施算力额度限制。这套规则跟手机流量套餐有点像:所有客户的算力使用都纳入一个每周滚动更新的5小时窗口,同时有明确的每周使用上限,超了就临时掐掉。其他谷歌云企业客户当然也受到了影响,但Meta对Gemini算力的依赖度和需求量都远超普通客户,所以被“卡”得最狠。
算力供给突然出现缺口,Meta的AI研发节奏直接被带乱。多个内部人工智能项目因为拿不到足够的Gemini算力,相关研发工作只能被迫推迟。为了在有限额度内保住核心项目,Meta内部已经正式发通知,要求全体员工节约使用AI词元(token)——优化调用逻辑、精简无效请求,把每一份算力都用在刀刃上,尽可能在配额之内多干点活。
别把这事看作两家巨头之间的孤立摩擦,它其实是全球AI产业发展阶段的一个缩影。这些年,各大科技企业砸了几十亿美元买高端AI芯片、建超大规模数据中心,拼了命想跟上算力增长。但市场对AI服务的需求增速,依然远远超过基础设施的建设速度。连谷歌这种持续加码AI投入的巨头都扛不住,算力供给缺口已经是制约整个产业规模化落地的核心瓶颈,这一点毋庸置疑。
从更深层的行业视角看,这次事件给所有AI玩家敲了一记警钟:在大模型和智能体技术快速迭代的今天,算力早已不是可以无限供应的底层资源,而是决定企业研发节奏、业务落地速度的核心战略资源。未来很长一段时间里,谁能把算力调度和供需调配做得更精,谁就能在竞争中抢到先手。整个行业也将在算力供给的倒逼下,去探索更高效的调度机制、更精简的推理技术,推动AI产业在有限资源下走出一条更高质量的发展路径。
-
- 网名带郑和霍字的网名女有哪些
- 角色扮演 | 1
- 网名