首页

手游

资讯

专题

首页 > 教程攻略 > ai资讯 >Google 悄悄开闸：Gemini API 免费放量 1M TPM，OpenAI 和 Anthropic 开发者坐不住了

Google 悄悄开闸：Gemini API 免费放量 1M TPM，OpenAI 和 Anthropic 开发者坐不住了

来源：互联网时间：2026-06-30 14:57:53

你肯定想不到：一个 Google 账号，免费，就能拿到 Gemini API，还带 100 万 TPM 的速率限制。这不是画饼，是 6 月 28 日一个开发者 @k2sbhai 在 X 上贴出的实锤，配文就两个词：

free, 1M TPM

。帖子瞬间炸了，上千个书签，评论区两极分化——有人感慨“搁置的创业想法突然有了奔头”，也有人截图反驳：“我的仪表盘上明明只有 250k”。

▲ @k2sbhai 主帖，展示 Gemini 2.5 免费 1M TPM 额度与上手步骤，1.4k 赞、12 万+ 浏览

到底谁说了算？别急，我们先看官方怎么说。

官方白纸黑字：Free of Charge

打开 Google 的 Gemini API 定价页，答案摆在那：

Free 层

，输入和输出 tokens 完全免费，在 Google AI Studio 里就能直接用。唯一附加条件是免费提交的内容可能被用于产品改进（付费后可以关闭）。

▲ Google Gemini API 官方定价页，Free 层明确标注“Free input & output tokens”

覆盖的模型列表也够长：Gemini 2.5 Flash、Flash-Lite、2.5 Pro，甚至更早的 2.0 系列，全标注了 Free Tier 可用。文档措辞毫不含糊——“Start building free of charge with generous limits”。

这意味着什么？一个独立开发者，现在就能零预算拿到生产级速率限制的 Gemini API，支持文本、图像、音频、视频全模态输入。但事情远没这么简单。

Grok 下场泼冷水：大部分是炒作

就在帖子疯传的同时，X 上的 AI 助手 Grok 直接回复了一句：“Nah, mostly hype.”——不，大部分是炒作。

▲ Grok 官方账号回复：Flash 部分变体确实达到 ~1M TPM，但常见值是 250k，Pro 更严格

Grok 承认了几个事实：你确实能用 Google 账号免费生成 Gemini API 密钥，Flash 模型的部分变体确实能达到 ~1M TPM，多模态确实可用。但关键事实被混淆了——

Gemini 2.5 Flash 在免费层通常约 250k TPM / 10 RPM。2.5 Pro 严格得多，往往只有几十个请求/天。

配额因账号而异、因时间而异，登录 AI Studio 仪表盘才能看到你真实的数字。Grok 的结论：适合测试，别当成“随意无限”。社区反馈也印证了这一点——有巴西用户说当地看不到高额度，有人截图显示“500k max + 50 req/DAY”，还有人直接喊 Fake news。

真相大概率是这样的

：Google 的免费额度在动态调整，部分账号/模型组合确实能拿到 1M TPM，但绝非所有人都一样。官方文档也写明了——“Specified rate limits are not guaranteed”。

但即使是 250k，差距也已经碾压级

一个更冷静的分析来自 @stretchcloud。他算了一笔账：1M tokens/min 相当于每分钟约 250 个 GPT-4 级调用，费用为零。

▲ @stretchcloud 分析帖：免费 1M TPM 对 solo builder 和小团队是游戏规则改变者

直接对比一目了然：

OpenAI 免费层
：RPM 个位数到十位数，TPM 几万，需要信用卡验证，生产几乎必付费
Anthropic
：Claude API 没有面向消费者的免费入口，使用就得绑 billing
Groq / Together AI
：每月 200 美元的初创公司现在有理由重新评估了

结论很直白：

赢家是独立构建者和小团队，输家是 API 转售商。

即便你只拿到 250k TPM 的 Flash 额度，依然可以做正经事——跑 RAG 索引、批量分类用户反馈、处理多模态数据。这些过去都是付费才能碰的领域。

TPM 到底是什么？搞清楚三个数字

如果你对 API 限流还不熟，这里有个速成版：

TPM（Tokens Per Minute）
：每分钟允许输入的 token 总量上限。1M TPM = 一分钟内可以提交约 100 万 token 的输入
RPM（Requests Per Minute）
：每分钟请求次数上限。即使 token 没超，请求太频繁也会被限
RPD（Requests Per Day）
：每天请求总数，这个往往是真正的瓶颈

实际使用中，RPM 和 RPD 通常比 TPM 更早触发限制。比如 Flash 的 RPM 可能只有 10-15，意味着即使 TPM 够用，你也没法在一分钟内发几百个请求。Pro 的情况更极端：TPM 或许还行，但 RPD 可能低到几十。适合“关键一步”的深度推理，撑不起全量流水线。

记住这个公式

：实际可用吞吐 = min(TPM, RPM × 平均请求大小, RPD / 活跃分钟数)。三个限制，哪个最小哪个说了算。这不是什么高深理论，是每个 API 开发者都得摸爬滚打才能学会的常识。

从 Maps 到 Gemini：Google 的免费剧本从未改过

如果你在这个行业待得够久，会觉得这一幕似曾相识。Google Maps API，早期完全免费，大量应用基于它构建。等开发者迁移成本足够高，收费就来了。Firebase、BigQuery sandbox、Colab——同样的套路，同样的节奏。

现在轮到了推理层。Google 的逻辑一直很清晰：

把实验的边际成本推向零，把生产的确定性留给付费层。

一旦开发者习惯了 Gemini SDK、熟悉了多模态调用方式，切换到 OpenAI 或 Anthropic 的摩擦成本就会陡增。

定价页设计了平滑的升级路径：消费满 $100 自动升到 Tier 1，获得更高速率上限和 context caching 等高级功能。免费层给你的刚好够——够做实验、够跑 demo、够上瘾，但不够撑生产。教科书式的游击战操作。

4 步拿 Key，1 分钟上手

这可能是目前市面上最低摩擦的 AI API 获取体验：

打开
aistudio.google.com
用 Google 账号登录
在 playground 选择 Flash 或 Pro
点击
Get API key
，几秒生成

拿到 key 之后的最佳实践：

高并发简单任务
（分类、提取、批量补全）→ 用
Gemini 2.5 Flash
复杂推理
（长链 agent、大代码库分析）→ 用
Gemini 2.5 Pro
，但注意 RPD 限制
混合路由
：90% 请求走 Flash，10% 关键步骤走 Pro，最大化免费额度

▲ Google 官方速率限制文档，强调“在 AI Studio 查看你的活跃速率限制”

冷水要泼，但窗口真实存在

说完好处，风险也得讲清楚。首先，

额度不固定。

仪表盘今天显示 1M，明天可能变 250k。Google 的原话：“Specified rate limits are not guaranteed.”历史上已经有过多次用户报告 RPD 从 250 骤降到 20 的案例。

项目级共享。

同一个 Google Cloud 项目下的多个 key 共用一份配额，换 key 没用。

免费内容可能被用于训练。

如果你的 prompt 涉及敏感数据或客户信息，要么脱敏，要么直接上付费层。

地区差异。

有用户反馈不同国家和账号看到的额度完全不同。

但这些风险不影响一个核心判断：

对于还在验证想法的独立开发者和小团队，当前的窗口期值得抓住。

用零成本把原型跑起来、把 prompt 调好、把 workflow 搭好——这些积累不会因为额度变化而消失。

聪明的做法是，把 provider 抽象成一层接口。今天跑 Gemini 免费层，明天额度收紧就切 OpenAI 或自托管——核心逻辑不需要改。

Google 这次展示的高免费额度，本质上是 AI 基建价格战的又一轮加码。对开发者来说，该薅的羊毛薅，该存的 key 存，该跑的实验趁现在跑。

但别忘了去 AI Studio 查一下你自己的仪表盘数字——因为你看到的，很可能和推特上的截图不一样。

Google 悄悄开闸：Gemini API 免费放量 1M TPM，OpenAI 和 Anthropic 开发者坐不住了

free, 1M TPM

官方白纸黑字：Free of Charge

Free 层

Grok 下场泼冷水：大部分是炒作

Gemini 2.5 Flash 在免费层通常约 250k TPM / 10 RPM。2.5 Pro 严格得多，往往只有几十个请求/天。

真相大概率是这样的

但即使是 250k，差距也已经碾压级

OpenAI 免费层

Anthropic

Groq / Together AI

赢家是独立构建者和小团队，输家是 API 转售商。

TPM 到底是什么？搞清楚三个数字

TPM（Tokens Per Minute）

RPM（Requests Per Minute）

RPD（Requests Per Day）

记住这个公式

从 Maps 到 Gemini：Google 的免费剧本从未改过

把实验的边际成本推向零，把生产的确定性留给付费层。

4 步拿 Key，1 分钟上手

aistudio.google.com

Get API key

高并发简单任务

Gemini 2.5 Flash

复杂推理

Gemini 2.5 Pro

混合路由