北大与DeepSeek联合开源DSpark框架,高并发下生成速度提升超60%
来源:互联网
时间:2026-06-27 17:04:11
全链网报道,6月27日,DeepSeek联合北京大学正式发布了DSpark推理加速框架。这次发布瞄准的是大语言模型在真实生产场景中一个相当棘手的痛点:推理效率。尤其是在高并发环境下,如何让模型能够又快又稳地回答大量用户的请求,这其中的核心难题,一直是个绕不开的坎儿。
这个新框架目前已部署在DeepSeek-V4-Flash与DeepSeek-V4-Pro的预览版服务引擎中。从具体数据来看,相比此前生产环境采用的单token推测解码基线MTP-1,在保持同等吞吐量的前提下,DSpark框架能将单用户的生成速度提升60%到85%。这可不是一个小的跨步,对于需要应对大规模并发的线上服务来说,这样的性能提升意味着实实在在的成本优化和用户体验改善。

值得一提的是,这项技术的相关论文、训练代码以及模型检查点都已在GitHub平台的DeepSpec项目中开源。这意味着,不只是DeepSeek自身的服务能够受益,整个行业都能在此基础上进行二次开发或研究,这才是真正的技术红利所在。