首页 > 教程攻略 > ai资讯 >算力告急:谷歌限制 Gemini 模型调用,Meta 研发进度受阻

算力告急:谷歌限制 Gemini 模型调用,Meta 研发进度受阻

来源:互联网 时间:2026-06-30 15:53:03

算力告急:谷歌收紧Gemini API配额,Meta首当其冲

生成式人工智能的热潮还在持续升温,但一个现实问题已经摆上台面:算力资源,正变得异常金贵。最近,谷歌就因为Gemini AI平台的调用量激增,不得不开始收紧资源供应。说白了,供不应求了。

自2025年春季以来,Gemini API的请求量直接翻了一倍,算力底座承受的压力可想而知。为了确保生态系统的公平性,谷歌在2026年5月17日正式推行了基于算力额度的使用限制——类似手机流量套餐的滚动更新机制。简单说,超出配额的请求会被系统降频或限制,目的是保证所有合作伙伴在资源紧张的环境下,至少能拿到基础的调用支持。

在这波调整中,Meta受到的冲击最大。原因很简单:Meta对该模型的需求远超其他客户,谷歌此前已经明确表示无法足额满足其申请的算力配额。这个突发限制直接打乱了Meta内部多个AI项目的推进节奏。更棘手的是,Meta同时还在压缩人工智能研发成本——两面夹击之下,公司紧急要求员工优化调用流程,提升代码和令牌的使用效率,试图从每个环节“省”出算力。

行业人士普遍认为,这次资源调控暴露了全球AI算力底座的一个严峻现实:大模型能力不断飞跃,但支撑它们高效运转的基础算力基础设施建设速度,远远赶不上爆发式的应用需求。对于像Meta这样深度依赖云端算力的科技巨头而言,如何在资源受限的前提下维持研发速度,将成为下一阶段竞争的真正分水岭。