算力告急,四大力量涌入Token服务市场
Token,这个AI世界里的“硬通货”,如今正上演着一场从“打折促销”到“加价难求”的戏剧性转变。市场风向彻底变了。
“现在你有多少Token就能卖多少,整个市场供不应求。”百度智能云AI与大模型平台总经理忻舟一语道破现状。回想不久之前,Token还常常打折出售,如今却成了抢手货,推理需求异常强劲。AI Infra企业是石科技联合创始人毛运航也观察到,整个市场正从买方市场转向卖方市场,“以前API是降价的,是亏钱的。现在Token必须保证一定的消耗量,才能拿到比较好的价格和供应。”阿里云资深副总裁刘伟光则给出了一个更直观的数字:过去5个月,阿里云的Token调用量暴增了15倍。
市场热度飙升的背后,是真实需求的集中爆发。一个清晰的产业格局正在形成:
云大厂、模型公司、运营商,以及AI Infra企业
Token,从打折卖到加价都买不到
尽管Token销售紧俏,但一个有趣的现象是,各家云厂商并未借此机会敞开供应,反而在谨慎地分配自家宝贵的GPU资源,小心翼翼地平衡着内部模型训练和对外Token销售之间的关系。这背后的逻辑很现实:大家算明白了,训练出更好的模型,未来才能卖出更多的Token。一位大厂内部人士透露,现在内部各部门都在“抢卡”,最终往往需要通过复杂的“算账”来争夺资源。更关键的是,商业逻辑已经逆转——去年卖硬件设备更赚钱,Token打折卖;如今局面彻底翻转,“卖硬件不如卖Token”,大家开始收索纯硬件销售业务。
那么,Token为何“一夜之间”变得如此抢手?
刘伟光指出,AI编程(Coding)成了一个巨大的分水岭。它不仅催生了全新的应用,更将在未来一年内,解锁大量陈旧的遗留系统——那些因为程序太老而无法上云的应用,借助AI Coding获得了新生。更重要的是,编程的门槛被极大地降低了,非程序员也开始用自然语言“编程”,自己做报表、做分析、做项目预算,生产力得到了前所未有的释放。
而智能体(Agent)的普及,则从技术层面将Token消耗量推向了新高。毛运航形象地比喻道:“还什么都没做,Token就没了。”当Agent被赋予了执行任务的“手脚”后,完成一项任务的每一步操作都在消耗Token,消耗量呈指数级增长。
回顾过去两年,虽然每家大厂都给Token销售定下了考核指标,但执行起来困难重重。忻舟解释道,根本原因在于“市场没有那么多真实需求,很多调用属于低质调用,比如拿大模型去做数据清洗这类小模型就能胜任的工作。”随着智能体技术和模型能力的跃升,真正有价值、重度消耗Token的应用开始涌现。也正因如此,今年各家大厂都为Token销售定下了颇具雄心的目标,“这个目标,正是基于对市场真实需求的判断。”
面对这场突如其来的需求爆发,中国工程院院士郑纬民观察到了一个深刻的行业转向:
从MaaS(模型即服务)转向TaaS(Token as a Service)
Token,作为大模型处理信息的最小计量单位(大约1000个Token对应700-800个中文字符),如今扮演着三重角色:它是信息处理的基本单位,是不同算力消耗的计量映射,也正在成为行业定价与计费的标准单位。

如果说MaaS阶段解决了“模型可用性”的问题,计费方式还相对粗放(如按调用次数),那么TaaS则意味着AI算力像水电煤一样被封装成标准化服务,计费颗粒度精细到了Token这一最小单位。
郑纬民进一步揭示了这一演进背后的深层矛盾:当前的AI基础设施主要是为模型训练而设计的,行业普遍陷入“
算力基建昂贵、推理工程薄弱、Token产出效率低
转向了比拼每瓦特电力所能生产的Token效率
市场的争夺战已经打响。刘伟光估算,对于AI原生创业企业,Token支出几乎占其IT支出的100%;国内互联网企业的这一比例在15%到20%之间;而传统企业目前仍低于5%。阿里云已经对销售团队提出要求:客户的Token支出至少不低于其今年总支出的20%,并且
专门设置了纯做MaaS销售的岗位
忻舟则以央国企市场为例,预估其当前Token支出仅占总IT支出的1%左右,未来的增量空间堪称巨大。百度的策略是,今年首要任务是让智能体展现出实际效果,当客户看到明确价值后,再进行深度渗透和成本优化。
在算力整体吃紧的背景下,国产AI基础设施迎来了关键机会窗口。毛运航观察到,国产芯片开始崭露头角,陆续有产品能够支撑大规模集群供应。而是石科技的国产适配工作,也从过去小范围的“为爱发电”,升级为真正的生产级需求。“假如现在适配了某款国产芯片,能把新模型部署上去并达到生产级要求,基本上就把这家芯片的所有库存盘活了。”刘伟光则做出了一个更宏观的预判:当Token覆盖“一切”,整个市场的IT支出结构将发生根本性变化,软件外包、传统IT采购等模式都将面临产业重塑。Token,正在成为新时代的“水和电”。
四大流派的动作
Token成为“硬通货”的趋势已然明朗,四股主要力量随之快速入场,各自凭借独特优势展开布局。
首先是云大厂。
全栈能力
在产品层面,云厂商正经历从“云原生”、“AI原生”到“
Agent原生
第二股力量是模型公司。
第三股力量是运营商。
运营商是国内第一批大规模采购国产芯片的主力军

第四股力量是AI Infra企业。
国内AI Infra企业手握“国产适配”这张关键牌
Coding与Agent:最确定的“印钞机”
在纷繁复杂的Token服务方向中,收益最为明确、市场潜力最大的,当属面向Coding与Agent方向的大语言模型。有业内人士透露,各大厂推出的Coding订阅套餐看似单价不高,但实际上非常赚钱。原因在于包月模式下,大多数用户的真实消耗量远低于套餐上限,
“Coding套餐平均下来,比单纯卖Token利润更高”。
一位资深人士进一步指出,相比之下,视频生成等方向当前的商业价值远不及大语言模型。忻舟的判断更为直接:大语言模型一旦真正深入生产环境,能够产生的收益是巨大的,且“收入没有上限”。
刘伟光对此进行了深入分析。他认为,虽然广告、传媒、影视等领域市场空间巨大,但与Coding和Agent方向的大语言模型相比,完全不在一个量级。他的逻辑是:Coding不只是编程,它催生了能独立完成任务、提升生产力的Agent,而这一切都深度绑定于大语言模型。“我们现在所有火力最集中的点,就是Coding和Agent方向的大语言模型,这个市场的规模会比其它模型大非常多。”
他观察到,自Coding工具普及以来,应用开发速度明显加快。一旦“人人可编程”成为现实,每年诞生的新应用或Agent数量将是过去的数倍。这不仅是生产力的飞跃,更是对整个软件行业的结构性重塑。
AI Infra企业也敏锐地捕捉到了这一趋势。毛运航表示,如今几乎找不到不用AI辅助的程序员,海内外大厂都在用模型编程,整个行业已被悄然改变。Agent的兴起更是放大了这一效应。
“如何让代码稳定输出、如何高效利用缓存、如何将代码组织成完整项目,以及如何在可控范围内让Agent高效产出——这些工程化问题,正是当前业界讨论最集中的方向。”
对于Token市场未来的增长趋势,业界看法不尽相同。多数观点认为,2026年行业算力供给将非常紧张,且这种紧张态势可能延续;也有观点认为,当前的Token紧缺与国内外芯片供应周期有关,更长期的走势还需观察。
但一个明确的共识是:在有限的算力资源约束下,如何最大化单位Token的生产效率,已经成为释放AI生产力的核心命题。正如毛运航所言:“语言模型是一维的,自动驾驶是二维平面的,到低空经济、具身智能、世界模型就是三维的。从训练需求兴起,到推理全场景应用,又是一个量级的提升。在‘计算’这件事上,大家还会投入很长时间、很多功夫。”这场围绕Token效率的竞赛,才刚刚开始。