首页 > 教程攻略 > 热点新闻 >美团发布国产万亿参数大模型LongCat-2.0并全面开

美团发布国产万亿参数大模型LongCat-2.0并全面开

来源：互联网时间：2026-06-30 21:11:06

这一天终于来了。2026年6月30日，美团正式亮出了自家新一代大模型的底牌——LongCat-2.0，一个拥有1.6万亿参数的庞然大物，并且同步宣布开源。这不仅仅是一次模型发布，更是一个信号：国产大模型在万亿参数这条赛道上，已经具备了完全自主的战斗力。

先说一个硬核事实：LongCat-2.0是全球首个完全依托国产算力，走通了从预训练到推理全链路的万亿级大模型。它没有走任何捷径，是从零开始原生预训练出来的，总参数1.6万亿，原生支持100万token的超长上下文。这意味着什么？你可以把一整部《三体》三部曲丢进去，它仍然能清晰地理清每个伏笔和人物关系。

在正式官宣之前，LongCat-2.0其实已经在国际舞台上悄悄跑了一段时间了。数据是最诚实的：它在OpenRouter平台的累计调用量稳居全球前三；在Hermes评估体系下，月度调用量直接拿下了全球第一；而在Claude Code基准下，它的月度调用量也排在全球第二，仅次于那个大家都很熟悉的行业标杆——Claude Opus 4.8版本。这个成绩单，放在全球范围内也绝对是硬通货。

更值得关注的是它的开源策略。LongCat项目团队宣布，将分阶段把底层基础设施框架、高性能推理引擎以及完整的模型参数全部开放。这可不是开源一个“能用”的壳子，而是把看家的核心技术模块都摆上了台面。对于全球开发者社区来说，这等于拿到了一份罕见的国产算力大模型“全家桶”图纸。

这个模型的“伙食”也相当扎实。预训练数据总量超过30万亿tokens，涵盖高质量中文、英文、多语种文本以及多种编程语言代码。也就是说，它不仅是语言理解的好手，在跨语言和跨模态任务上，底子也打得非常深厚。

当然，万卡规模的国产集群训练，背后藏着什么挑战？硬件故障频发、节点间通信不稳定、显存资源紧张、数值计算漂移……这些真实存在的“坑”，一个都没少。但LongCat团队硬是把这些问题系统性啃了下来。必须强调的是，他们在稳定性、正确性和效率这三个维度上，拿出了实打实的突破。

先说稳定性。团队自研了一套HCCL异常容错机制，配合弹性扩缩容调度策略和全自动故障恢复流程，硬是把月均单日训练中断率降了七成以上。通俗点说，以前三天两头就罢工的训练集群，现在稳得像台老式打字机。

再说正确性。他们构建了一套确定性算子库，搞了逐位一致性校验和实时参数健康监测。这意味着训练过程不再是“黑盒子”，结果的可复现性和可靠性都上了个大台阶。同时，他们还优化了核心计算模块的数值精度，重构了Reduce通信逻辑，让关键路径的鲁棒性更强了。

最后看效率。靠精细化流水线调度、动态显存管理和算子级核资源调控，模型训练MFU（即模型计算效率）直接提升到了原来的一点五倍。最终的结果是，LongCat-2.0实现了稳定日均吞吐量超过1万亿tokens，成功走通了万亿参数MoE架构在纯国产算力平台上的全流程、高可用训练。这才是真正的技术壁垒所在。

美团发布国产万亿参数大模型LongCat-2.0并全面开

相关阅读

相关下载