首页 > 教程攻略 > ai资讯 >大厂AI内卷新姿势：Token变成新“PPT”

大厂AI内卷新姿势：Token变成新“PPT”

来源：互联网时间：2026-05-28 20:07:17

企业降本增效省下来的钱，可能正悄无声息地流进AI的“燃料箱”里，被无效的Token消耗一空。

最近，微软开始收紧内部对Claude Code的授权。根据The Verge的披露，微软的Experiences + Devices团队计划在6月底关停大部分第三方Claude Code的授权席位，全面转向自家的GitHub Copilot CLI。这一调整背后的核心驱动力之一，正是为了缓解日益增长的AI成本压力。相比之下，Uber面临的情况更为严峻。其CTO Pra veen Neppalli Naga公开坦言，公司为2026年全年准备的AI预算，仅仅四个月就已基本见底。

Meta则选择了一条截然不同的道路。他们在内部上线了Token消耗排行榜，对高用量员工授予“Token传奇”、“缓存魔法师”等称号，甚至将用量与绩效考核挂钩，实行末位淘汰。这套机制落地仅30天，效果“立竿见影”：Meta全员的Token总消耗量从6万亿飙升至73.7万亿，增幅超过12倍，AI消耗彻底失控。

一边在踩刹车，一边在踩油门，但大家面临的本质问题是一样的。整个行业至今缺乏一套成熟、稳定且可落地的AI价值衡量标准。于是，简单易统计的Token消耗量，便成了那个唯一、却也最危险的“硬指标”。

百度CEO李彦宏在两周前的大会上就一针见血地指出：Token好统计，但它不等于实际产出。一个员工让AI跑了更多Agent、塞进更长的上下文、反复试错，账单会飞速膨胀，但业务结果却未必同步改善。

Token KPI：一场制造浪费的考核实验

以最大化Token消耗为目标的工作方式，即所谓的“Tokenmaxxing”，自去年底开始在硅谷蔓延，如今也已传导至国内。阿里、腾讯、字节等大厂的技术团队，都已不同程度地将Token使用量纳入转正和晋升的参考体系。

当考核与Token用量深度绑定，职场形式主义便迅速向AI工作场景蔓延。据《财经》报道，不少员工为了“达标”，刻意让AI Agent批量读取上万行代码、堆砌数万字的文献数据，单纯依靠“堆工作量”来刷高Token消耗，并无实际工作产出。这并非个例，公开数据显示，全球企业级AI应用中，近半数的Token消耗都属于无效浪费。

Meta那73.7万亿的Token里，究竟有多少真正转化为了有效产出？这恰恰是所有Token KPI制度最核心的漏洞。

与硅谷企业面临成本焦虑不同，国内头部大厂正通过高额的Token补贴，全力降低员工的AI使用门槛。

从不同渠道披露的信息来看，各家的福利政策各有侧重：腾讯为核心研发人员配备了年度22.8万元的Token专属套餐，外加每月1000美元的外部工具报销额度；字节对内开放AI工具不限量使用，员工业余体验AI可报销50%，技术岗年上限为1000美元；百度为技术岗配备文心一言无限量使用权，并给予最高800美元/年的外部Token补贴；360则更为直接，给全员充了1亿Token。

AI工具已经不再是一个简单的办公软件插件，它正在演变为新的生产资料。过去，企业给员工配的是电脑、软件账号、云盘和报销额度；现在，研发、设计、产品、运营等岗位都可能需要模型调用额度。尤其在代码生成、Agent工作流、视频生成、知识检索这些场景里，Token就是驱动生产的燃料。

问题在于，燃料发出去了，油耗怎么算、价值怎么衡量，很多公司还没想清楚。

吞金的Agent，算不清的变量账

Uber的内部数据，精准暴露了企业AI成本失控的核心机制漏洞。目前，其95%的工程师常态化使用AI编码工具，单人每月AI调用成本在500至2000美元之间，70%的代码提交由AI生成，AI Agent每周可完成1800次代码变更，相关工作量占比从不足1%攀升至8%。

从业务落地视角看，这无疑是AI渗透率的大幅提升；但对企业财务部门而言，这意味着原本刚性可控的IT成本体系被彻底打破。

成本失控的根源，在于AI Agent自身的高消耗特性。Gartner指出，完成同等任务量，Agent的Token消耗是传统聊天机器人的5至30倍。高盛更是预测，到2030年，全球Token月消耗量将达到约120 quadrillion（约12亿亿），是2026年水平的24倍，其核心驱动力正是企业端Agent的规模化部署。

传统SaaS按席位计费，IT部门可以在采购时锁定全年的支出上限。但AI工具的成本结构与此根本不兼容。Token账单随使用行为动态增长，而财务部门缺乏历史数据来建立成本基准，IT部门没有成熟工具进行实时追踪与成本分摊，业务部门在推广使用时，也往往没有同步建立成本归因机制。

不是AI没有用，而是企业的FinOps（财务运营）体系完全没跟上AI的消费速度。于是，我们看到了微软和Uber紧急踩下刹车。

员工在薅羊毛，业务在画饼

国内公司的现状，与硅谷略有不同。硅谷的焦虑在于用量跑得太快、账单超支；而国内大厂更现实的尴尬是：钱花出去了，员工用得却不够深，实际业务价值依然模糊。

从C端数据来看，国内AI应用热度空前高涨。量子位智库2026年行业报告显示，今年4月国内AI应用Web端月访问量突破9亿次，APP端月下载量超2.4亿、日活达6.7亿，同比增幅达223%。QuestMobile数据同步印证，截至2026年3月，国内AI原生APP月活用户达4.4亿，豆包、千问、DeepSeek稳居行业前三。

然而，火热的C端数据，并未同步转化为企业端的生产力增量。埃森哲《2025中国企业数字化转型指数》数据显示，国内46%的企业已启动AI适配与落地，但仅9%的企业实现了显著的业务价值突破。绝大多数企业的AI落地，仍停留在浅层试用、盲目推广、摸索场景的初级阶段。

内容创作、客服问答、代码辅助等浅层场景，AI落地门槛低、见效快；但在核心研发、供应链管理、财务风控、组织协同等关键业务环节，AI落地的适配难度、合规门槛和落地成本都呈指数级提升。

大厂全员发放Token补贴，目的是通过资金让利来降低AI试错成本，强行推动全员融入AI工作流。这套打法有其合理性：只有达到足够的使用密度，才能倒逼企业筛选出适配业务的真实场景，同时培养员工的AI使用习惯。

但问题是，只鼓励使用而不建立价值度量体系，福利就会演变成纯粹的账单压力，同时催生出卷“PPT”、卷“文档”式的伪AI工作方式。

AI对职场的渗透速度远超预期。据Cognizant 2026年报告测算，美国93%的岗位都将不同程度受到AI冲击，这一预判比此前估计的提前了整整6年。

主要岗位的AI渗透正在呈现全面爆发态势。数据显示，2023年管理、金融运营、行政支持类岗位的AI暴露度仅为14%-21%，如今已飙升至60%-68%；律师岗位的AI暴露度从9%跃升至63%，就连CEO岗位的AI理论暴露度也突破了60%。报告同时强调，理论渗透不代表实际替代，责任问责、行业监管以及人类的主观判断，仍是制约AI全面落地的核心壁垒。

这意味着，AI将继续进入更多岗位，Token消耗也会从研发部门扩散到更广泛的组织层面。企业真正要面对的挑战，是如何判断一笔Token花得值不值。

挤掉Token泡沫：从“用量崇拜”转向“效率度量”

Token本身不是问题。企业想要搭建成熟的AI生产力体系，必然需要充足的Token投入作为支撑。行业乱象的核心症结，从来不是“Token用太多”，而是“把Token用量当成了唯一目标”。

Meta的Token排行榜机制，看似激活了全员使用AI的热情，一定程度上推动了员工尝试新工具，但无法规避其核心漏洞：Token消耗总量，与员工的真实业务产出毫无直接关联。

而微软、Uber的成本危机也印证，单纯一刀切地缩减Token额度，只是治标不治本，反而可能误伤那些真正高效的AI办公场景。

李彦宏尝试给出一个答案，他提出了DAA（Daily Active Agent，日活跃Agent数）的概念，主张用每日活跃的Agent数量来衡量AI的实际渗透程度，而非单纯的Token消耗总量。这个方向有其道理，但具体计算方式和有效性也有待完善，毕竟一个“活跃”的Agent也未必能真正跑通有价值的业务流程。

企业的核心转型方向，应是彻底摒弃对Token的盲目崇拜，转而建立AI效率思维。

考核研发的AI工作质量，重点应看AI生成代码的合并通过率、缺陷率、返工率以及项目交付周期的变化，而非单纯的调用频次；考核客服场景，核心应关注问题的一次解决率、人工接管率与用户满意度；评估营销内容场景，则应侧重产出效率、转化效果与合规风险把控；针对AI Agent工作流，则需要重点排查无效重试、冗余上下文、不合理模型调用等浪费行为。

这套精细化的成本与价值管理体系，其核心逻辑在于精准区分有效AI调用与无效资源消耗，从根本上斩断那种纯粹为了“堆量”而进行的浪费行为。

随着AI向深处落地，Token将成为与电费、云服务费、人力成本并列的核心生产性开支。硅谷企业正在为前期的盲目扩量补课，国内企业则仍在依靠补贴普及AI使用。

从Token到DAA，是从“烧了多少”走向“跑了多少”，算是向前迈出了一步。但关于“值多少”这个终极问题，目前还没有人能给出真正令人信服的答案。

大厂AI内卷新姿势：Token变成新“PPT”

Token KPI：一场制造浪费的考核实验

吞金的Agent，算不清的变量账

员工在薅羊毛，业务在画饼

挤掉Token泡沫：从“用量崇拜”转向“效率度量”

相关阅读

相关下载