Token经济深水区,算力产业还有无数的坑要填
AI产业正经历一场底层变革,其节奏之快,已经渗透到芯片、基础设施,再到模型和应用,无一幸免。过去我们谈工具,现在聊的是生产要素——Token经济。而支撑这一切的算力,也在从单纯的资源供给,升级为面向Token生产的系统能力。
这股爆发式的需求,让“Token工厂”成了资本和产业界的香饽饽,也成为今年各大厂商发力的关键点。整个产业正在从“能力竞争”迈入“生产范式竞争”的新阶段,对算力规模、效率以及能效的要求,都上了一个新台阶。
回头看那些算力基础设施服务商,过去几十年熟悉的“稳态”路线,如今已经过时。他们需要做的,是把分散、复杂的AI能力,转化为标准化、规模化的生产能力,为客户提供面向未来的企业级AI解决方案。
国际核能院院士、中国人工智能学会会士张勤说得直白:“随着AI从语言理解迈向对物理世界的认知与交互,算力基础设施也必须从单点供给升级为算力、网络与能源协同的系统性底座,才能真正支撑智能应用的规模化落地。”
理想很丰满,但通往Token经济的路,显然没那么简单。从算力层到应用层、模型层,每一步都遍布着亟待跨越的障碍。
算力产品底层逻辑已经改写
Token正在彻底重构算力世界,成为中国AI产业的“新货币”。有机构预测,2026年中国整体Token调用量将达到日均306.3万亿,到2030年有望飙升至19306万亿,五年间的复合增长率高达210%。在Token经济的冲击下,算力基础设施的底层逻辑,不言而喻,正在被彻底碘伏。
回想AI还没火的时候,服务器产品主要围绕通用计算和超算,产品规划基本是跟着上游CPU厂商的路线走。芯片路线图通常三五年内都很清晰,不会有大的变动,因此基础设施产品的定义就是“稳态”:提前把未来三五年都规划好。
那时的设计出发点就是量产,要适配所有CPU、各种型号的SSD、HHD,中间还要反复验证,确保产品在客户手上、每一种配置都不会出问题。所有客户的需求、成本都要摸清楚,保证产品一上市就是爆款。
但AI时代来了,一切都变了。产品路线出现了不确定性,尤其是GPU,常常产品还没上市,就已经过时了。
“等你摸清楚所有市场的需求,你摸清楚的那些可能已经变了。”联想中国基础设施业务群服务器事业部总经理周韬坦言,模型、应用的更新迭代更快。比如DeepSeek这边刚能搞一体机,等你搞出来,好像就已经过时了。今年年初龙虾火了一把,最近热度也下去了。
如果继续沿用“稳态”模式跟跑,只会永远慢市场半拍。算力产品的研发逻辑正在全面转向“敏态”。所谓敏态,核心就是放弃“全量适配、一步量产”的传统思路。
现在,客户要的配置相对单一,没那么复杂了。不需要把所有能想到的配置都进行交叉验证。快速迭代,最好让客户看哪个是真的需要的,快速形成一个产品,送测后,客户觉得不错,再转为量产。
“这样可以把原来从18个月,甚至更长演化、规划的时间,缩短到几个月,投资成本也会降低很多。原来一年的研发预算只能投两三个产品,现在这种敏捷模式,我就能投10个、15个产品。并不需要每个都成功,可能投10个,有三四个成功就行。”周韬说道。
基于这套逻辑,联想问天也改变了原有的产品规划模式,新推出了万全异构智算平台V5.0、超节点解决方案,并提出到2027年联想中国基础设施群实现1000亿元的业绩目标。他们的目标很明确:推动算力基础设施从“资源支撑载体”向“Token生产系统”转变。
周韬表示:“我们的目标,是让客户以更高效率、更低成本实现AI规模化应用,让算力从资源供给真正转化为可交付、可扩展、可持续的生产能力。”
Token工厂,还有无数的坑要填
产品研发逻辑的迭代,只是AI时代下变革的第一步。联想问天正在做的,一方面是通过AI工厂、超智融合算力与全栈产品体系,把分散、复杂的AI能力转化为标准化、规模化的生产能力;另一方面,则是构建高性能、低成本、可持续的基础设施底座,为客户提供面向未来的企业AI解决方案。
但当你真的试图把算力中心变成“Token工厂”,才会发现,面前还有无数的坑要填。
比如计算系统,就需要六大工艺来填补,每一项都决定着Token的成本与效率。有计算调优工艺,还有缓存的工艺。目前国产卡做推理,最大的瓶颈就在缓存,需要进一步做好KVcache命中以及缓存的量化。谷歌的相关技术论文曾让存储板块股价大幅波动,可想而知缓存优化对Token效率的影响有多大,这也是国内算力厂商必须啃下的硬骨头。
除此之外,在计算层面,还要做好容错、用电、通信以及能耗的工艺等。这些工艺上的差距,恰恰解释了为什么同样是GPU配置,不同厂商的集群跑出的Token吞吐量会天差地别。
填完计算的坑,还有数据治理、能效管理、安全合规、运维管理等短板需要解决。联想中国基础设施业务群战略总监黄山透露,在安全层面,他们正与火山合作,因为全中国被攻击最狠的就是豆包。“现在的测试版本到了第二版,接近满意,我希望第三轮之后,在7月份把它发到市场,目标是能达到火山在公有云防豆包攻击的测试水平。”
需要强调的是,对于整个Token经济来说,算力基础设施并不能解决所有卡点。黄山坦言,即便把数据、计算、安全、能效这些坑都填平,也只是能经营好一个AIDC,卖Token而已。AI应用落地会怎样?模型选对了没有?智能体做得好不好?在AIDC之上,还有几个关键卡点。
简单来说,如果上层应用不成熟,对Token的需求就起不来,算力投资就难以收回成本。Token成本居高不下,企业就不敢大规模投入应用创新,场景永远跑不出来。
“好在全世界那么多大咖下了很大决心往里砸钱,我们希望这些钱能用在正确的地方。”黄山说道。