首页 > 教程攻略 > ai资讯 >大厂AI内卷新姿势:Token变成新“PPT”

大厂AI内卷新姿势:Token变成新“PPT”

来源:互联网 时间:2026-05-28 20:07:17

企业降本增效省下来的钱,可能正悄无声息地流进AI的“燃料箱”里,被无效的Token消耗一空。

最近,微软开始收紧内部对Claude Code的授权。根据The Verge的披露,微软的Experiences + Devices团队计划在6月底关停大部分第三方Claude Code的授权席位,全面转向自家的GitHub Copilot CLI。这一调整背后的核心驱动力之一,正是为了缓解日益增长的AI成本压力。相比之下,Uber面临的情况更为严峻。其CTO Pra veen Neppalli Naga公开坦言,公司为2026年全年准备的AI预算,仅仅四个月就已基本见底。

Meta则选择了一条截然不同的道路。他们在内部上线了Token消耗排行榜,对高用量员工授予“Token传奇”、“缓存魔法师”等称号,甚至将用量与绩效考核挂钩,实行末位淘汰。这套机制落地仅30天,效果“立竿见影”:Meta全员的Token总消耗量从6万亿飙升至73.7万亿,增幅超过12倍,AI消耗彻底失控。

一边在踩刹车,一边在踩油门,但大家面临的本质问题是一样的。整个行业至今缺乏一套成熟、稳定且可落地的AI价值衡量标准。于是,简单易统计的Token消耗量,便成了那个唯一、却也最危险的“硬指标”。

百度CEO李彦宏在两周前的大会上就一针见血地指出:Token好统计,但它不等于实际产出。一个员工让AI跑了更多Agent、塞进更长的上下文、反复试错,账单会飞速膨胀,但业务结果却未必同步改善。

Token KPI:一场制造浪费的考核实验

以最大化Token消耗为目标的工作方式,即所谓的“Tokenmaxxing”,自去年底开始在硅谷蔓延,如今也已传导至国内。阿里、腾讯、字节等大厂的技术团队,都已不同程度地将Token使用量纳入转正和晋升的参考体系。

当考核与Token用量深度绑定,职场形式主义便迅速向AI工作场景蔓延。据《财经》报道,不少员工为了“达标”,刻意让AI Agent批量读取上万行代码、堆砌数万字的文献数据,单纯依靠“堆工作量”来刷高Token消耗,并无实际工作产出。这并非个例,公开数据显示,全球企业级AI应用中,近半数的Token消耗都属于无效浪费。

Meta那73.7万亿的Token里,究竟有多少真正转化为了有效产出?这恰恰是所有Token KPI制度最核心的漏洞。

与硅谷企业面临成本焦虑不同,国内头部大厂正通过高额的Token补贴,全力降低员工的AI使用门槛。

从不同渠道披露的信息来看,各家的福利政策各有侧重:腾讯为核心研发人员配备了年度22.8万元的Token专属套餐,外加每月1000美元的外部工具报销额度;字节对内开放AI工具不限量使用,员工业余体验AI可报销50%,技术岗年上限为1000美元;百度为技术岗配备文心一言无限量使用权,并给予最高800美元/年的外部Token补贴;360则更为直接,给全员充了1亿Token。

AI工具已经不再是一个简单的办公软件插件,它正在演变为新的生产资料。过去,企业给员工配的是电脑、软件账号、云盘和报销额度;现在,研发、设计、产品、运营等岗位都可能需要模型调用额度。尤其在代码生成、Agent工作流、视频生成、知识检索这些场景里,Token就是驱动生产的燃料。

问题在于,燃料发出去了,油耗怎么算、价值怎么衡量,很多公司还没想清楚。

吞金的Agent,算不清的变量账

Uber的内部数据,精准暴露了企业AI成本失控的核心机制漏洞。目前,其95%的工程师常态化使用AI编码工具,单人每月AI调用成本在500至2000美元之间,70%的代码提交由AI生成,AI Agent每周可完成1800次代码变更,相关工作量占比从不足1%攀升至8%。

从业务落地视角看,这无疑是AI渗透率的大幅提升;但对企业财务部门而言,这意味着原本刚性可控的IT成本体系被彻底打破。

成本失控的根源,在于AI Agent自身的高消耗特性。Gartner指出,完成同等任务量,Agent的Token消耗是传统聊天机器人的5至30倍。高盛更是预测,到2030年,全球Token月消耗量将达到约120 quadrillion(约12亿亿),是2026年水平的24倍,其核心驱动力正是企业端Agent的规模化部署。

传统SaaS按席位计费,IT部门可以在采购时锁定全年的支出上限。但AI工具的成本结构与此根本不兼容。Token账单随使用行为动态增长,而财务部门缺乏历史数据来建立成本基准,IT部门没有成熟工具进行实时追踪与成本分摊,业务部门在推广使用时,也往往没有同步建立成本归因机制。

不是AI没有用,而是企业的FinOps(财务运营)体系完全没跟上AI的消费速度。于是,我们看到了微软和Uber紧急踩下刹车。

员工在薅羊毛,业务在画饼

国内公司的现状,与硅谷略有不同。硅谷的焦虑在于用量跑得太快、账单超支;而国内大厂更现实的尴尬是:钱花出去了,员工用得却不够深,实际业务价值依然模糊。

从C端数据来看,国内AI应用热度空前高涨。量子位智库2026年行业报告显示,今年4月国内AI应用Web端月访问量突破9亿次,APP端月下载量超2.4亿、日活达6.7亿,同比增幅达223%。QuestMobile数据同步印证,截至2026年3月,国内AI原生APP月活用户达4.4亿,豆包、千问、DeepSeek稳居行业前三。

然而,火热的C端数据,并未同步转化为企业端的生产力增量。埃森哲《2025中国企业数字化转型指数》数据显示,国内46%的企业已启动AI适配与落地,但仅9%的企业实现了显著的业务价值突破。绝大多数企业的AI落地,仍停留在浅层试用、盲目推广、摸索场景的初级阶段。

内容创作、客服问答、代码辅助等浅层场景,AI落地门槛低、见效快;但在核心研发、供应链管理、财务风控、组织协同等关键业务环节,AI落地的适配难度、合规门槛和落地成本都呈指数级提升。

大厂全员发放Token补贴,目的是通过资金让利来降低AI试错成本,强行推动全员融入AI工作流。这套打法有其合理性:只有达到足够的使用密度,才能倒逼企业筛选出适配业务的真实场景,同时培养员工的AI使用习惯。

但问题是,只鼓励使用而不建立价值度量体系,福利就会演变成纯粹的账单压力,同时催生出卷“PPT”、卷“文档”式的伪AI工作方式。

AI对职场的渗透速度远超预期。据Cognizant 2026年报告测算,美国93%的岗位都将不同程度受到AI冲击,这一预判比此前估计的提前了整整6年。

主要岗位的AI渗透正在呈现全面爆发态势。数据显示,2023年管理、金融运营、行政支持类岗位的AI暴露度仅为14%-21%,如今已飙升至60%-68%;律师岗位的AI暴露度从9%跃升至63%,就连CEO岗位的AI理论暴露度也突破了60%。报告同时强调,理论渗透不代表实际替代,责任问责、行业监管以及人类的主观判断,仍是制约AI全面落地的核心壁垒。

这意味着,AI将继续进入更多岗位,Token消耗也会从研发部门扩散到更广泛的组织层面。企业真正要面对的挑战,是如何判断一笔Token花得值不值。

挤掉Token泡沫:从“用量崇拜”转向“效率度量”

Token本身不是问题。企业想要搭建成熟的AI生产力体系,必然需要充足的Token投入作为支撑。行业乱象的核心症结,从来不是“Token用太多”,而是“把Token用量当成了唯一目标”。

Meta的Token排行榜机制,看似激活了全员使用AI的热情,一定程度上推动了员工尝试新工具,但无法规避其核心漏洞:Token消耗总量,与员工的真实业务产出毫无直接关联。

而微软、Uber的成本危机也印证,单纯一刀切地缩减Token额度,只是治标不治本,反而可能误伤那些真正高效的AI办公场景。

李彦宏尝试给出一个答案,他提出了DAA(Daily Active Agent,日活跃Agent数)的概念,主张用每日活跃的Agent数量来衡量AI的实际渗透程度,而非单纯的Token消耗总量。这个方向有其道理,但具体计算方式和有效性也有待完善,毕竟一个“活跃”的Agent也未必能真正跑通有价值的业务流程。

企业的核心转型方向,应是彻底摒弃对Token的盲目崇拜,转而建立AI效率思维。

考核研发的AI工作质量,重点应看AI生成代码的合并通过率、缺陷率、返工率以及项目交付周期的变化,而非单纯的调用频次;考核客服场景,核心应关注问题的一次解决率、人工接管率与用户满意度;评估营销内容场景,则应侧重产出效率、转化效果与合规风险把控;针对AI Agent工作流,则需要重点排查无效重试、冗余上下文、不合理模型调用等浪费行为。

这套精细化的成本与价值管理体系,其核心逻辑在于精准区分有效AI调用与无效资源消耗,从根本上斩断那种纯粹为了“堆量”而进行的浪费行为。

随着AI向深处落地,Token将成为与电费、云服务费、人力成本并列的核心生产性开支。硅谷企业正在为前期的盲目扩量补课,国内企业则仍在依靠补贴普及AI使用。

从Token到DAA,是从“烧了多少”走向“跑了多少”,算是向前迈出了一步。但关于“值多少”这个终极问题,目前还没有人能给出真正令人信服的答案。

相关下载