大厂Token不再“管够”：腾讯开始限额，字节可部分报销

来源：互联网时间：2026-06-16 14:35:31

6月刚冒头，腾讯内部就传出一个让不少程序员心头一紧的消息：内部管理看板上，自己分到的Token额度悄悄缩水了。有员工透露，之前一个月是2000美元（约1.35万元软妹币）的额度，这个月直接砍到了只有1400元软妹币，“两天就用没了”。

据经济观察报不完全统计，目前腾讯不同部门员工的月Token额度差异挺大，从1000元到7000元软妹币不等。具体操作方式是：额度先分配到组，再由组长往下发。如果额度不够，员工可以向管理者“举手申请”提高。

放眼国内几家大厂，员工Token的分配方式大致分两种：要么额度直接到个人，超额部分自费后可以部分报销；要么额度算到部门，纳入部门预算，由管理者内部调配。

说到底，不管分给谁、怎么分，分的都是买Token的真金白银。Agent大规模介入工作后，Token消耗呈指数级增长，算力成本实实在在地挤压着大厂的利润。到了2026年年中，从微软、Meta到国内的顶级科技公司，都开始踩下内部AI无限使用的刹车，监控、限制、动态调配员工用量。

额度一缩，焦虑就来了。一些员工担心自己是不是要回到“古法编程”时代。由奢入俭的阵痛开始了：是坚持手搓代码，还是自掏腰包继续“花钱打工”？

“大锅饭”结束了

腾讯是国内最早动手控额的大厂之一。据经济观察报了解，从6月起，腾讯多个业务的Token额度都在降，而且部门间差异明显：AI需求最旺盛的混元大模型团队，员工月额度大约7000元；聚焦计算机视觉的优图实验室，额度约5250元；而一位腾讯娱乐外包员工透露，自己的月额度只有1000元。

“组内共用一个额度池，组长来分配。”一位腾讯员工说，“这是这个月的暂行办法，下个月可能还要调整。”

就在今年3月，脉脉上还有消息说腾讯给员工配了“每人年均22万元的Token资源”，包含每月700美元Cursor、700美元Claude、1000美元CodeBuddy等额度，目的是鼓励大家用AI提效。当时不少腾讯员工都证实了这件事。

AI用起来之后，另一个问题也随之浮出水面：Token用量会不会和考核挂钩？3月底，就有腾讯员工在脉脉同事圈发帖称，部分业务已经开始统计各部门、团队的Token用量并排名。于是有些员工担心自己用量不够，甚至在工作时间搭建毫无意义的工作流，让Agent重复跑任务，或者处理个人需求，甚至“接私活”，只为确保用量不落后。

这次调整，腾讯有意改变以往以Token消耗量作为单一衡量标准的“大锅饭”模式。据经济观察报了解，2026年腾讯还会持续加码Token投入，但不再按统一标准分配。具体来说：部门管理者会根据工作情况动态分配资源；员工有额外需求可以申请加量；内部不再搞Token使用量排名，不再单纯看消耗量来评判产出。

Token超了怎么办？

当然，头疼的不止腾讯一家。其他大厂，各有各的玩法。

在产研等AI使用程度较高的岗位，阿里员工每月额度大约8000元，不限制模型，员工普遍反映处理日常需求“基本够用”；京东员工可不限量调用自家模型，调用外部模型的费用分摊到部门；美团那边，有员工说还没听到明确的额度标准，但在用内部AI产品时，经常遇到“模型变笨”的情况，怀疑是因为调用量太大被降级到了质量更低的模型。

而在字节，画风又不一样。员工可以不限量调用TRAE（字节自研AI IDE产品）内的模型，包括GPT、Gemini、Grok等；如果需要调用其他模型，产生的费用可以部分报销，有部门报销标准是实际支出的50%，产研岗位年度报销上限为1000美元，其他岗位是300美元。

从这些信号来看，大厂们正在达成一个共识：AI要用，但Token得管，否则成本真可能失控。

5月20日的2026阿里云峰会上，米哈游《崩坏》系列AI NPC & Gameplay技术团队负责人郑银河分享了一个例子：有团队搭建了几十个Agent共同协作，结果一晚上烧掉了大约200万元软妹币的Token。

另一家AI初创企业的研发人员告诉经济观察报，他们团队约50人，过去一个月的Token成本约20万美元，人均达到4000美元，“主要用于编码，编码质量高的模型价格都高。老板已经让节省一些，后面考虑换便宜点的模型。”

OpenAI CEO Sam Altman在6月初的一场直播中也坦言，AI支出已经成为企业的大问题，而“在年初时，人们还对自己的花费非常满意”。

换低价模型，或自费补额度

“看板上写着，如果Token不够，可以找负责人去加额度。”一位腾讯员工说，他原来的月Token额度约3000美元，6月看板更新后，额度只剩5000元软妹币，“发下来三天就用没了，Agent和Subagent跑起来，额度烧得飞快”。他赶紧向上级主管申请提额，但得到的反馈是部门预算有限，被拒绝了。“每个部门上限不一样，得看业务情况。”

这次腾讯的额度调整主要针对外部模型，员工依然可以不限量使用自家混元大模型。这直接导致混元的调用量有所增长。但有员工反映，换回混元后工作效率下降，使用体验也差了不少，“幻觉很严重，而且不是专用于编码的模型，还不如手搓。”

公司给的额度不够用怎么办？有腾讯员工选择自己掏钱，订阅了每月200美元的Codex Pro 20x。他算过一笔账：“用混元的话，基础需求都要跑很久，失败了还得重跑，浪费时间。虽然不想自费打工，但总比没额度用要好，这个价格也还能接受。”

即便是在额度相对充裕的字节，也不是能用得随心所欲。“我自己和身边大部分同事都用GPT-5.5，公司内的模型接口天天排长队。”一位字节研发人员透露，即便这个模型在公司付费范围内，仍有员工选择用个人账号自费订阅，为的就是避免排队耽误进度。

额度受限后，员工发现很难再回到AI介入前的纯人工模式。“工作量已经涨上去了，不会因为Token少了就降下来。而且用上AI以后，我很难再回归古法编程了。”一位腾讯员工的困惑，其实也是很多人的心声。

当Token同时牵动成本和产能，企业到底该怎么分、分多少？大厂们，还在摸着石头过河。

大厂Token不再“管够”：腾讯开始限额，字节可部分报销

“大锅饭”结束了

“大锅饭”结束了

Token超了怎么办？

Token超了怎么办？

换低价模型，或自费补额度

换低价模型，或自费补额度

相关阅读

相关下载