中国信通院联合10家企业启动“Token服务能力攀登计划”
先说一个核心判断:大模型应用真正要跑通,Token 服务能力不再只是锦上添花,而是刚需。最近,在高质量词元服务研讨会上,中国信通院联合华&为云、蚂蚁数科、移动九天、联通元景、京东云、联想百应、浪潮海岳、浩鲸科技、天云数据、派欧云共10家企业,正式启动了“Token服务能力攀登计划”,同时发布了首批攀登成果。
这其实释放了一个非常明确的信号——行业内正在建立可量化的服务基准。首批参与的企业,均达到企业级通用场景下的Token服务性能攀登基线。具体来看,核心指标有三:每秒输出Token数(TPS)不低于55 Token/s;首Token时延(TTFT)控制在0.9秒以内;调用成功率更是要求达到99.9%。
说白了,这三个数字就是现阶段Token服务能力的分水岭。TPS决定了吞吐量,TTFT影响着用户的第一感受,而调用成功率直接关系到业务能不能真正跑起来。99.9%这个目标,意味着在规模化落地阶段,服务稳定性已经成了硬约束。

从参与企业阵容来看,既有云厂商、金融科技公司,也有运营商和产业互联网平台,覆盖了从底层算力到上层应用的多个环节。这本身就说明,Token服务的性能优化不再是单一厂商的孤岛问题,而是需要全产业链协同制定的标准。
值得关注的是,这次发布的首批结果不仅是“验收”,更像是一次“定标”。大家可以把它理解为行业对Token服务能力的一次集体校准——你做到了什么水平,才能称得上企业级可用?答案就写在基线数据里。对于正在选型或者自建服务的企业来说,这三个数字也是个很有价值的参照系。
当然,攀登计划才刚刚启动。随着场景复杂度提升,比如多轮对话、长文档生成、实时推理等,对Token服务能力的要求只会更高。下一步,业内可能会看到更细分的场景基线、更严格的时延要求,甚至跨厂商的互操作性测试。这才是推动技术落地的务实做法——先定标杆,再逐步抬高标准。