首页 > 教程攻略 > ai资讯 >算力告急,四大力量涌入Token服务市场

算力告急,四大力量涌入Token服务市场

来源:互联网 时间:2026-05-27 11:43:05

Token,这个AI世界里的“硬通货”,如今正上演着一场从“打折促销”到“加价难求”的戏剧性转变。市场风向彻底变了。

“现在你有多少Token就能卖多少,整个市场供不应求。”百度智能云AI与大模型平台总经理忻舟一语道破现状。回想不久之前,Token还常常打折出售,如今却成了抢手货,推理需求异常强劲。AI Infra企业是石科技联合创始人毛运航也观察到,整个市场正从买方市场转向卖方市场,“以前API是降价的,是亏钱的。现在Token必须保证一定的消耗量,才能拿到比较好的价格和供应。”阿里云资深副总裁刘伟光则给出了一个更直观的数字:过去5个月,阿里云的Token调用量暴增了15倍。

市场热度飙升的背后,是真实需求的集中爆发。一个清晰的产业格局正在形成:

云大厂、模型公司、运营商,以及AI Infra企业

,这四股力量已经迅速行动起来,围绕Token服务市场展开布局。

Token,从打折卖到加价都买不到

尽管Token销售紧俏,但一个有趣的现象是,各家云厂商并未借此机会敞开供应,反而在谨慎地分配自家宝贵的GPU资源,小心翼翼地平衡着内部模型训练和对外Token销售之间的关系。这背后的逻辑很现实:大家算明白了,训练出更好的模型,未来才能卖出更多的Token。一位大厂内部人士透露,现在内部各部门都在“抢卡”,最终往往需要通过复杂的“算账”来争夺资源。更关键的是,商业逻辑已经逆转——去年卖硬件设备更赚钱,Token打折卖;如今局面彻底翻转,“卖硬件不如卖Token”,大家开始收索纯硬件销售业务。

那么,Token为何“一夜之间”变得如此抢手?

核心驱动力在于真实应用场景的爆发。

刘伟光指出,AI编程(Coding)成了一个巨大的分水岭。它不仅催生了全新的应用,更将在未来一年内,解锁大量陈旧的遗留系统——那些因为程序太老而无法上云的应用,借助AI Coding获得了新生。更重要的是,编程的门槛被极大地降低了,非程序员也开始用自然语言“编程”,自己做报表、做分析、做项目预算,生产力得到了前所未有的释放。

而智能体(Agent)的普及,则从技术层面将Token消耗量推向了新高。毛运航形象地比喻道:“还什么都没做,Token就没了。”当Agent被赋予了执行任务的“手脚”后,完成一项任务的每一步操作都在消耗Token,消耗量呈指数级增长。

回顾过去两年,虽然每家大厂都给Token销售定下了考核指标,但执行起来困难重重。忻舟解释道,根本原因在于“市场没有那么多真实需求,很多调用属于低质调用,比如拿大模型去做数据清洗这类小模型就能胜任的工作。”随着智能体技术和模型能力的跃升,真正有价值、重度消耗Token的应用开始涌现。也正因如此,今年各家大厂都为Token销售定下了颇具雄心的目标,“这个目标,正是基于对市场真实需求的判断。”

面对这场突如其来的需求爆发,中国工程院院士郑纬民观察到了一个深刻的行业转向:

从MaaS(模型即服务)转向TaaS(Token as a Service)

。虽然很多企业并不刻意区分这两个概念,但行业的关注焦点已经无可争议地围绕Token展开。

Token,作为大模型处理信息的最小计量单位(大约1000个Token对应700-800个中文字符),如今扮演着三重角色:它是信息处理的基本单位,是不同算力消耗的计量映射,也正在成为行业定价与计费的标准单位。

如果说MaaS阶段解决了“模型可用性”的问题,计费方式还相对粗放(如按调用次数),那么TaaS则意味着AI算力像水电煤一样被封装成标准化服务,计费颗粒度精细到了Token这一最小单位。

郑纬民进一步揭示了这一演进背后的深层矛盾:当前的AI基础设施主要是为模型训练而设计的,行业普遍陷入“

算力基建昂贵、推理工程薄弱、Token产出效率低

”的困局。他的判断是,AI基础设施的竞赛,已经从单纯比拼算力集群的规模,

转向了比拼每瓦特电力所能生产的Token效率

市场的争夺战已经打响。刘伟光估算,对于AI原生创业企业,Token支出几乎占其IT支出的100%;国内互联网企业的这一比例在15%到20%之间;而传统企业目前仍低于5%。阿里云已经对销售团队提出要求:客户的Token支出至少不低于其今年总支出的20%,并且

专门设置了纯做MaaS销售的岗位

,主攻AI原生创业公司和个人开发者。他们的策略清晰而聚焦:一是全员出动,铺开覆盖面;二是开放模型策略,部署在阿里云上的模型一律按“一方模型”对待;三是重构考核指标,重点关注付费Token客户数的增长、核心系统接入Token的效率,以及Agent完成闭环任务的效率。

忻舟则以央国企市场为例,预估其当前Token支出仅占总IT支出的1%左右,未来的增量空间堪称巨大。百度的策略是,今年首要任务是让智能体展现出实际效果,当客户看到明确价值后,再进行深度渗透和成本优化。

在算力整体吃紧的背景下,国产AI基础设施迎来了关键机会窗口。毛运航观察到,国产芯片开始崭露头角,陆续有产品能够支撑大规模集群供应。而是石科技的国产适配工作,也从过去小范围的“为爱发电”,升级为真正的生产级需求。“假如现在适配了某款国产芯片,能把新模型部署上去并达到生产级要求,基本上就把这家芯片的所有库存盘活了。”刘伟光则做出了一个更宏观的预判:当Token覆盖“一切”,整个市场的IT支出结构将发生根本性变化,软件外包、传统IT采购等模式都将面临产业重塑。Token,正在成为新时代的“水和电”。

四大流派的动作

Token成为“硬通货”的趋势已然明朗,四股主要力量随之快速入场,各自凭借独特优势展开布局。

首先是云大厂。

它们是最早提出Token服务概念的一方,核心优势在于

全栈能力

——从自研芯片、算力基础设施到上层模型,几乎实现了全覆盖。无论是百度提出的“芯、云、模、体”,还是阿里云强调的“芯-云-模型-推理”,路径都指向一体化。刘伟光去年就曾指出,云大厂的“胜负手”在于性价比,而全栈技术是实现极致性价比的核心。今年他特别强调了芯片与模型的深度绑定:“模型训练背后是强大的算力支撑,两者齿轮咬合、螺旋上升。所以我们一定要走自己的道路,更加强调云、芯、模一体化。”

在产品层面,云厂商正经历从“云原生”、“AI原生”到“

Agent原生

”的演进。整个云技术栈和服务体系,几乎都需要为智能体应用重做一遍。目前,各家企业正对产品线进行系统性改造,同时,它们不仅推广Token销售,也亲自下场,将Token包装成Coding、各类Agent等应用,率先完成从Token生产到价值应用的商业闭环。

第二股力量是模型公司。

这类公司包括智谱、Minimax、Kimi等,它们的战略重心与云大厂截然不同,更专注于模型本身。它们通过API提供Token服务,也委托产业链其他伙伴销售模型调用。尽管一些头部模型公司市值已达数千亿,但根据产业链多方观察,其实际营收和现金流规模仍有较大成长空间,因此普遍选择轻资产运营,自持算力基础设施不多。它们的核心目标很明确:让研发出的模型卖得更好,Token化是实现这一目标的手段。例如,在天翼云近期面向开发者的Token套餐中,就接入了智谱GLM5等模型。

第三股力量是运营商。

今年5月,三大运营商集体推出Token套餐服务,动作迅速。实际上,中国电信总经理刘桂清早在4月就曾表示,以Token为核心的新型经营模式正在重塑传统产业分工。运营商的核心优势得天独厚:既拥有数据中心、算力与网络资源,又具备直达海量用户的“最后一公里”触达能力和覆盖全国的属地化服务体系。AI被Token化后,其计费逻辑与话费、流量相似,运营商可以凭借成熟的运营经验推动AI普及。更值得关注的是,

运营商是国内第一批大规模采购国产芯片的主力军

,有极强的动力推动国产芯片生态适配。面对当前算力利用率低、异构算力碎片化、国产适配周期长(往往需要数月)而模型迭代又极快的挑战,运营商正利用其生态整合能力,动员各方力量推进多芯适配与多模融合,成为国产生态的关键推手。

第四股力量是AI Infra企业。

这是当前融资热度最高的赛道之一。Agent应用的爆发推高了Token消耗,也重塑了这类企业的商业逻辑。过去“赚差价、算不过账”的窘境正在改变,行业从买方市场转向卖方市场,让商业化路径变得清晰。这类企业中,有对标美国Corewa ve、主攻大规模集群运营与国产芯片适配的是石科技;有因快速部署大模型而备受关注的硅基流动,主要聚焦MaaS层;还有最早提出“MxN”(M种模型、N种芯片)概念的无问芯穹,定位为中间的适配层。尽管美国同类企业Corewa ve面临模型公司与芯片巨头的双重挤压,但毛运航指出,

国内AI Infra企业手握“国产适配”这张关键牌

。国内市场对国产芯片适配有迫切需求,而单靠硬件厂商远远不够,需要芯片厂、AI Infra企业、应用方共同跑通整个链条。“一个是国产,一个是调优,这是我们在这一波发展中找到的明确机会。”

Coding与Agent:最确定的“印钞机”

在纷繁复杂的Token服务方向中,收益最为明确、市场潜力最大的,当属面向Coding与Agent方向的大语言模型。有业内人士透露,各大厂推出的Coding订阅套餐看似单价不高,但实际上非常赚钱。原因在于包月模式下,大多数用户的真实消耗量远低于套餐上限,

“Coding套餐平均下来,比单纯卖Token利润更高”。

一位资深人士进一步指出,相比之下,视频生成等方向当前的商业价值远不及大语言模型。忻舟的判断更为直接:大语言模型一旦真正深入生产环境,能够产生的收益是巨大的,且“收入没有上限”。

刘伟光对此进行了深入分析。他认为,虽然广告、传媒、影视等领域市场空间巨大,但与Coding和Agent方向的大语言模型相比,完全不在一个量级。他的逻辑是:Coding不只是编程,它催生了能独立完成任务、提升生产力的Agent,而这一切都深度绑定于大语言模型。“我们现在所有火力最集中的点,就是Coding和Agent方向的大语言模型,这个市场的规模会比其它模型大非常多。”

他观察到,自Coding工具普及以来,应用开发速度明显加快。一旦“人人可编程”成为现实,每年诞生的新应用或Agent数量将是过去的数倍。这不仅是生产力的飞跃,更是对整个软件行业的结构性重塑。

AI Infra企业也敏锐地捕捉到了这一趋势。毛运航表示,如今几乎找不到不用AI辅助的程序员,海内外大厂都在用模型编程,整个行业已被悄然改变。Agent的兴起更是放大了这一效应。

“如何让代码稳定输出、如何高效利用缓存、如何将代码组织成完整项目,以及如何在可控范围内让Agent高效产出——这些工程化问题,正是当前业界讨论最集中的方向。”

对于Token市场未来的增长趋势,业界看法不尽相同。多数观点认为,2026年行业算力供给将非常紧张,且这种紧张态势可能延续;也有观点认为,当前的Token紧缺与国内外芯片供应周期有关,更长期的走势还需观察。

但一个明确的共识是:在有限的算力资源约束下,如何最大化单位Token的生产效率,已经成为释放AI生产力的核心命题。正如毛运航所言:“语言模型是一维的,自动驾驶是二维平面的,到低空经济、具身智能、世界模型就是三维的。从训练需求兴起,到推理全场景应用,又是一个量级的提升。在‘计算’这件事上,大家还会投入很长时间、很多功夫。”这场围绕Token效率的竞赛,才刚刚开始。