首页 > 教程攻略 > ai资讯 >大厂Token不再“管够”:腾讯开始限额,字节可部分报销

大厂Token不再“管够”:腾讯开始限额,字节可部分报销

来源:互联网 时间:2026-06-16 14:35:31

6月刚冒头,腾讯内部就传出一个让不少程序员心头一紧的消息:内部管理看板上,自己分到的Token额度悄悄缩水了。有员工透露,之前一个月是2000美元(约1.35万元软妹币)的额度,这个月直接砍到了只有1400元软妹币,“两天就用没了”。

大厂Token不再“管够”:腾讯开始限额,字节可部分报销

据经济观察报不完全统计,目前腾讯不同部门员工的月Token额度差异挺大,从1000元到7000元软妹币不等。具体操作方式是:额度先分配到组,再由组长往下发。如果额度不够,员工可以向管理者“举手申请”提高。

放眼国内几家大厂,员工Token的分配方式大致分两种:要么额度直接到个人,超额部分自费后可以部分报销;要么额度算到部门,纳入部门预算,由管理者内部调配。

说到底,不管分给谁、怎么分,分的都是买Token的真金白银。Agent大规模介入工作后,Token消耗呈指数级增长,算力成本实实在在地挤压着大厂的利润。到了2026年年中,从微软、Meta到国内的顶级科技公司,都开始踩下内部AI无限使用的刹车,监控、限制、动态调配员工用量。

额度一缩,焦虑就来了。一些员工担心自己是不是要回到“古法编程”时代。由奢入俭的阵痛开始了:是坚持手搓代码,还是自掏腰包继续“花钱打工”?

“大锅饭”结束了

腾讯是国内最早动手控额的大厂之一。据经济观察报了解,从6月起,腾讯多个业务的Token额度都在降,而且部门间差异明显:AI需求最旺盛的混元大模型团队,员工月额度大约7000元;聚焦计算机视觉的优图实验室,额度约5250元;而一位腾讯娱乐外包员工透露,自己的月额度只有1000元。

“组内共用一个额度池,组长来分配。”一位腾讯员工说,“这是这个月的暂行办法,下个月可能还要调整。”

就在今年3月,脉脉上还有消息说腾讯给员工配了“每人年均22万元的Token资源”,包含每月700美元Cursor、700美元Claude、1000美元CodeBuddy等额度,目的是鼓励大家用AI提效。当时不少腾讯员工都证实了这件事。

AI用起来之后,另一个问题也随之浮出水面:Token用量会不会和考核挂钩?3月底,就有腾讯员工在脉脉同事圈发帖称,部分业务已经开始统计各部门、团队的Token用量并排名。于是有些员工担心自己用量不够,甚至在工作时间搭建毫无意义的工作流,让Agent重复跑任务,或者处理个人需求,甚至“接私活”,只为确保用量不落后。

这次调整,腾讯有意改变以往以Token消耗量作为单一衡量标准的“大锅饭”模式。据经济观察报了解,2026年腾讯还会持续加码Token投入,但不再按统一标准分配。具体来说:部门管理者会根据工作情况动态分配资源;员工有额外需求可以申请加量;内部不再搞Token使用量排名,不再单纯看消耗量来评判产出。

Token超了怎么办?

当然,头疼的不止腾讯一家。其他大厂,各有各的玩法。

在产研等AI使用程度较高的岗位,阿里员工每月额度大约8000元,不限制模型,员工普遍反映处理日常需求“基本够用”;京东员工可不限量调用自家模型,调用外部模型的费用分摊到部门;美团那边,有员工说还没听到明确的额度标准,但在用内部AI产品时,经常遇到“模型变笨”的情况,怀疑是因为调用量太大被降级到了质量更低的模型。

而在字节,画风又不一样。员工可以不限量调用TRAE(字节自研AI IDE产品)内的模型,包括GPT、Gemini、Grok等;如果需要调用其他模型,产生的费用可以部分报销,有部门报销标准是实际支出的50%,产研岗位年度报销上限为1000美元,其他岗位是300美元。

从这些信号来看,大厂们正在达成一个共识:AI要用,但Token得管,否则成本真可能失控。

5月20日的2026阿里云峰会上,米哈游《崩坏》系列AI NPC & Gameplay技术团队负责人郑银河分享了一个例子:有团队搭建了几十个Agent共同协作,结果一晚上烧掉了大约200万元软妹币的Token。

另一家AI初创企业的研发人员告诉经济观察报,他们团队约50人,过去一个月的Token成本约20万美元,人均达到4000美元,“主要用于编码,编码质量高的模型价格都高。老板已经让节省一些,后面考虑换便宜点的模型。”

OpenAI CEO Sam Altman在6月初的一场直播中也坦言,AI支出已经成为企业的大问题,而“在年初时,人们还对自己的花费非常满意”。

换低价模型,或自费补额度

“看板上写着,如果Token不够,可以找负责人去加额度。”一位腾讯员工说,他原来的月Token额度约3000美元,6月看板更新后,额度只剩5000元软妹币,“发下来三天就用没了,Agent和Subagent跑起来,额度烧得飞快”。他赶紧向上级主管申请提额,但得到的反馈是部门预算有限,被拒绝了。“每个部门上限不一样,得看业务情况。”

这次腾讯的额度调整主要针对外部模型,员工依然可以不限量使用自家混元大模型。这直接导致混元的调用量有所增长。但有员工反映,换回混元后工作效率下降,使用体验也差了不少,“幻觉很严重,而且不是专用于编码的模型,还不如手搓。”

公司给的额度不够用怎么办?有腾讯员工选择自己掏钱,订阅了每月200美元的Codex Pro 20x。他算过一笔账:“用混元的话,基础需求都要跑很久,失败了还得重跑,浪费时间。虽然不想自费打工,但总比没额度用要好,这个价格也还能接受。”

即便是在额度相对充裕的字节,也不是能用得随心所欲。“我自己和身边大部分同事都用GPT-5.5,公司内的模型接口天天排长队。”一位字节研发人员透露,即便这个模型在公司付费范围内,仍有员工选择用个人账号自费订阅,为的就是避免排队耽误进度。

额度受限后,员工发现很难再回到AI介入前的纯人工模式。“工作量已经涨上去了,不会因为Token少了就降下来。而且用上AI以后,我很难再回归古法编程了。”一位腾讯员工的困惑,其实也是很多人的心声。

当Token同时牵动成本和产能,企业到底该怎么分、分多少?大厂们,还在摸着石头过河。

相关下载