首页 > 教程攻略 > ai资讯 >算力告急，四大力量涌入Token服务市场

算力告急，四大力量涌入Token服务市场

来源：互联网时间：2026-05-27 11:43:05

Token，这个AI世界里的“硬通货”，如今正上演着一场从“打折促销”到“加价难求”的戏剧性转变。市场风向彻底变了。

“现在你有多少Token就能卖多少，整个市场供不应求。”百度智能云AI与大模型平台总经理忻舟一语道破现状。回想不久之前，Token还常常打折出售，如今却成了抢手货，推理需求异常强劲。AI Infra企业是石科技联合创始人毛运航也观察到，整个市场正从买方市场转向卖方市场，“以前API是降价的，是亏钱的。现在Token必须保证一定的消耗量，才能拿到比较好的价格和供应。”阿里云资深副总裁刘伟光则给出了一个更直观的数字：过去5个月，阿里云的Token调用量暴增了15倍。

市场热度飙升的背后，是真实需求的集中爆发。一个清晰的产业格局正在形成：

云大厂、模型公司、运营商，以及AI Infra企业

，这四股力量已经迅速行动起来，围绕Token服务市场展开布局。

Token，从打折卖到加价都买不到

尽管Token销售紧俏，但一个有趣的现象是，各家云厂商并未借此机会敞开供应，反而在谨慎地分配自家宝贵的GPU资源，小心翼翼地平衡着内部模型训练和对外Token销售之间的关系。这背后的逻辑很现实：大家算明白了，训练出更好的模型，未来才能卖出更多的Token。一位大厂内部人士透露，现在内部各部门都在“抢卡”，最终往往需要通过复杂的“算账”来争夺资源。更关键的是，商业逻辑已经逆转——去年卖硬件设备更赚钱，Token打折卖；如今局面彻底翻转，“卖硬件不如卖Token”，大家开始收索纯硬件销售业务。

那么，Token为何“一夜之间”变得如此抢手？

核心驱动力在于真实应用场景的爆发。

刘伟光指出，AI编程（Coding）成了一个巨大的分水岭。它不仅催生了全新的应用，更将在未来一年内，解锁大量陈旧的遗留系统——那些因为程序太老而无法上云的应用，借助AI Coding获得了新生。更重要的是，编程的门槛被极大地降低了，非程序员也开始用自然语言“编程”，自己做报表、做分析、做项目预算，生产力得到了前所未有的释放。

而智能体（Agent）的普及，则从技术层面将Token消耗量推向了新高。毛运航形象地比喻道：“还什么都没做，Token就没了。”当Agent被赋予了执行任务的“手脚”后，完成一项任务的每一步操作都在消耗Token，消耗量呈指数级增长。

回顾过去两年，虽然每家大厂都给Token销售定下了考核指标，但执行起来困难重重。忻舟解释道，根本原因在于“市场没有那么多真实需求，很多调用属于低质调用，比如拿大模型去做数据清洗这类小模型就能胜任的工作。”随着智能体技术和模型能力的跃升，真正有价值、重度消耗Token的应用开始涌现。也正因如此，今年各家大厂都为Token销售定下了颇具雄心的目标，“这个目标，正是基于对市场真实需求的判断。”

面对这场突如其来的需求爆发，中国工程院院士郑纬民观察到了一个深刻的行业转向：

从MaaS（模型即服务）转向TaaS（Token as a Service）

。虽然很多企业并不刻意区分这两个概念，但行业的关注焦点已经无可争议地围绕Token展开。

Token，作为大模型处理信息的最小计量单位（大约1000个Token对应700-800个中文字符），如今扮演着三重角色：它是信息处理的基本单位，是不同算力消耗的计量映射，也正在成为行业定价与计费的标准单位。

如果说MaaS阶段解决了“模型可用性”的问题，计费方式还相对粗放（如按调用次数），那么TaaS则意味着AI算力像水电煤一样被封装成标准化服务，计费颗粒度精细到了Token这一最小单位。

郑纬民进一步揭示了这一演进背后的深层矛盾：当前的AI基础设施主要是为模型训练而设计的，行业普遍陷入“

算力基建昂贵、推理工程薄弱、Token产出效率低

”的困局。他的判断是，AI基础设施的竞赛，已经从单纯比拼算力集群的规模，

转向了比拼每瓦特电力所能生产的Token效率

。

市场的争夺战已经打响。刘伟光估算，对于AI原生创业企业，Token支出几乎占其IT支出的100%；国内互联网企业的这一比例在15%到20%之间；而传统企业目前仍低于5%。阿里云已经对销售团队提出要求：客户的Token支出至少不低于其今年总支出的20%，并且

专门设置了纯做MaaS销售的岗位

，主攻AI原生创业公司和个人开发者。他们的策略清晰而聚焦：一是全员出动，铺开覆盖面；二是开放模型策略，部署在阿里云上的模型一律按“一方模型”对待；三是重构考核指标，重点关注付费Token客户数的增长、核心系统接入Token的效率，以及Agent完成闭环任务的效率。

忻舟则以央国企市场为例，预估其当前Token支出仅占总IT支出的1%左右，未来的增量空间堪称巨大。百度的策略是，今年首要任务是让智能体展现出实际效果，当客户看到明确价值后，再进行深度渗透和成本优化。

在算力整体吃紧的背景下，国产AI基础设施迎来了关键机会窗口。毛运航观察到，国产芯片开始崭露头角，陆续有产品能够支撑大规模集群供应。而是石科技的国产适配工作，也从过去小范围的“为爱发电”，升级为真正的生产级需求。“假如现在适配了某款国产芯片，能把新模型部署上去并达到生产级要求，基本上就把这家芯片的所有库存盘活了。”刘伟光则做出了一个更宏观的预判：当Token覆盖“一切”，整个市场的IT支出结构将发生根本性变化，软件外包、传统IT采购等模式都将面临产业重塑。Token，正在成为新时代的“水和电”。

四大流派的动作

Token成为“硬通货”的趋势已然明朗，四股主要力量随之快速入场，各自凭借独特优势展开布局。

首先是云大厂。

它们是最早提出Token服务概念的一方，核心优势在于

全栈能力

——从自研芯片、算力基础设施到上层模型，几乎实现了全覆盖。无论是百度提出的“芯、云、模、体”，还是阿里云强调的“芯-云-模型-推理”，路径都指向一体化。刘伟光去年就曾指出，云大厂的“胜负手”在于性价比，而全栈技术是实现极致性价比的核心。今年他特别强调了芯片与模型的深度绑定：“模型训练背后是强大的算力支撑，两者齿轮咬合、螺旋上升。所以我们一定要走自己的道路，更加强调云、芯、模一体化。”

在产品层面，云厂商正经历从“云原生”、“AI原生”到“

Agent原生

”的演进。整个云技术栈和服务体系，几乎都需要为智能体应用重做一遍。目前，各家企业正对产品线进行系统性改造，同时，它们不仅推广Token销售，也亲自下场，将Token包装成Coding、各类Agent等应用，率先完成从Token生产到价值应用的商业闭环。

第二股力量是模型公司。

这类公司包括智谱、Minimax、Kimi等，它们的战略重心与云大厂截然不同，更专注于模型本身。它们通过API提供Token服务，也委托产业链其他伙伴销售模型调用。尽管一些头部模型公司市值已达数千亿，但根据产业链多方观察，其实际营收和现金流规模仍有较大成长空间，因此普遍选择轻资产运营，自持算力基础设施不多。它们的核心目标很明确：让研发出的模型卖得更好，Token化是实现这一目标的手段。例如，在天翼云近期面向开发者的Token套餐中，就接入了智谱GLM5等模型。

第三股力量是运营商。

今年5月，三大运营商集体推出Token套餐服务，动作迅速。实际上，中国电信总经理刘桂清早在4月就曾表示，以Token为核心的新型经营模式正在重塑传统产业分工。运营商的核心优势得天独厚：既拥有数据中心、算力与网络资源，又具备直达海量用户的“最后一公里”触达能力和覆盖全国的属地化服务体系。AI被Token化后，其计费逻辑与话费、流量相似，运营商可以凭借成熟的运营经验推动AI普及。更值得关注的是，

运营商是国内第一批大规模采购国产芯片的主力军

，有极强的动力推动国产芯片生态适配。面对当前算力利用率低、异构算力碎片化、国产适配周期长（往往需要数月）而模型迭代又极快的挑战，运营商正利用其生态整合能力，动员各方力量推进多芯适配与多模融合，成为国产生态的关键推手。

第四股力量是AI Infra企业。

这是当前融资热度最高的赛道之一。Agent应用的爆发推高了Token消耗，也重塑了这类企业的商业逻辑。过去“赚差价、算不过账”的窘境正在改变，行业从买方市场转向卖方市场，让商业化路径变得清晰。这类企业中，有对标美国Corewa ve、主攻大规模集群运营与国产芯片适配的是石科技；有因快速部署大模型而备受关注的硅基流动，主要聚焦MaaS层；还有最早提出“MxN”（M种模型、N种芯片）概念的无问芯穹，定位为中间的适配层。尽管美国同类企业Corewa ve面临模型公司与芯片巨头的双重挤压，但毛运航指出，

国内AI Infra企业手握“国产适配”这张关键牌

。国内市场对国产芯片适配有迫切需求，而单靠硬件厂商远远不够，需要芯片厂、AI Infra企业、应用方共同跑通整个链条。“一个是国产，一个是调优，这是我们在这一波发展中找到的明确机会。”

Coding与Agent：最确定的“印钞机”

在纷繁复杂的Token服务方向中，收益最为明确、市场潜力最大的，当属面向Coding与Agent方向的大语言模型。有业内人士透露，各大厂推出的Coding订阅套餐看似单价不高，但实际上非常赚钱。原因在于包月模式下，大多数用户的真实消耗量远低于套餐上限，

“Coding套餐平均下来，比单纯卖Token利润更高”。

一位资深人士进一步指出，相比之下，视频生成等方向当前的商业价值远不及大语言模型。忻舟的判断更为直接：大语言模型一旦真正深入生产环境，能够产生的收益是巨大的，且“收入没有上限”。

刘伟光对此进行了深入分析。他认为，虽然广告、传媒、影视等领域市场空间巨大，但与Coding和Agent方向的大语言模型相比，完全不在一个量级。他的逻辑是：Coding不只是编程，它催生了能独立完成任务、提升生产力的Agent，而这一切都深度绑定于大语言模型。“我们现在所有火力最集中的点，就是Coding和Agent方向的大语言模型，这个市场的规模会比其它模型大非常多。”

他观察到，自Coding工具普及以来，应用开发速度明显加快。一旦“人人可编程”成为现实，每年诞生的新应用或Agent数量将是过去的数倍。这不仅是生产力的飞跃，更是对整个软件行业的结构性重塑。

AI Infra企业也敏锐地捕捉到了这一趋势。毛运航表示，如今几乎找不到不用AI辅助的程序员，海内外大厂都在用模型编程，整个行业已被悄然改变。Agent的兴起更是放大了这一效应。

“如何让代码稳定输出、如何高效利用缓存、如何将代码组织成完整项目，以及如何在可控范围内让Agent高效产出——这些工程化问题，正是当前业界讨论最集中的方向。”

对于Token市场未来的增长趋势，业界看法不尽相同。多数观点认为，2026年行业算力供给将非常紧张，且这种紧张态势可能延续；也有观点认为，当前的Token紧缺与国内外芯片供应周期有关，更长期的走势还需观察。

但一个明确的共识是：在有限的算力资源约束下，如何最大化单位Token的生产效率，已经成为释放AI生产力的核心命题。正如毛运航所言：“语言模型是一维的，自动驾驶是二维平面的，到低空经济、具身智能、世界模型就是三维的。从训练需求兴起，到推理全场景应用，又是一个量级的提升。在‘计算’这件事上，大家还会投入很长时间、很多功夫。”这场围绕Token效率的竞赛，才刚刚开始。