首页 > 教程攻略 > ai资讯 >大厂速度!京东云首发上线MiniMax M3 大模型,推理效率迎跨越式升级

大厂速度!京东云首发上线MiniMax M3 大模型,推理效率迎跨越式升级

来源:互联网 时间:2026-06-04 15:52:05

今天,MiniMax M3模型正式面向市场发布。而京东云的JoyBuilder模型开发平台,几乎是在同一时间完成了接入,并且立刻向广大用户开放了相关服务。

这次技术迭代的关键,其实在于推理性能的显著改善。在应用部署层面,平台不仅用上了自研的推理框架,还把PD分离部署、KV Cache缓存、投机采样这些前沿的推理优化技术深度整合到了一起。换句话说,底层技术组合拳已经打好了。

这一系列技术的协同发力,让新接入的模型在实际运行中实现了更高的推理吞吐量,整体响应效率也大幅提升。对开发者来说,调用体验会更流畅;从更宏观的视角看,这也有望加速前沿大模型在具体业务场景中的落地应用——这才是重中之重。