首页 > 教程攻略 > ai资讯 >蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源

蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源

来源：互联网时间：2026-06-20 15:59:07

蚂蚁百灵大模型系列迎来关键更新：Ling-2.6-flash 全面开放

蚂蚁集团旗下的百灵大模型系列，今天有个值得关注的新动态：Ling-2.6-flash模型正式向全球开发者敞开了大门。为了应对不同的硬件环境和切实降低部署门槛，这次更新同步带来了BF16、FP8以及INT4等多个精度版本。目的很明确，就是给开发者提供更灵活、更具弹性的推理选择。

这款模型的总参数量达到了104B，而激活参数量为7.4B，属于Instruct模型。有意思的是，在正式官宣之前，它曾以“Elephant Alpha”这个匿名身份，在OpenRouter平台上悄悄进行了为期两周的试运行。这段“实战测试”收获了大量来自真实场景的反馈，研发团队据此进行了针对性优化。结果是？模型在中英文自然切换的流畅度上显著增强，在主流编程框架中的适配表现也更加出色了。

技术亮点：混合架构与极致效率

说到Ling-2.6-flash的核心竞争力，离不开其独特的架构设计和令人印象深刻的运行效率：

混合线性架构：
通过底层的计算优化，模型的推理速度表现极佳。在4卡H20的环境下，最高推理速度能达到340 tokens/s。更值得一提的是其Prefill（预填充）吞吐量，达到了Nemotron-3-Super的2.2倍，这对于大幅缩短响应延迟至关重要。
出色的“智效比”：
研发团队在训练阶段对Token效率进行了深度校准。评测数据揭示了一个关键优势：完成同等质量的任务，Ling-2.6-flash仅需消耗约15M tokens。这个数值大约只是同类竞品的十分之一，意味着商用成本得到了极大程度的控制。

场景深耕：定向增强智能体能力

当前大模型最火热的应用场景之一莫过于Agent（智能体），而Ling-2.6-flash对此进行了专项强化。无论是复杂的工具调用、需要逻辑的多步规划，还是最终的任务执行，模型的表现都相当稳健。在BFCL-V4、SWE-bench等一系列行业主流评测中，即便面对激活参数规模更大的对手，它依然能保持相近甚至达到行业顶尖（SOTA）的水平。

目前，开发者已经可以通过Hugging Face和ModelScope（魔搭社区）获取该模型的开源资源。这无疑为探索其在各行业应用中的潜力，铺平了道路。

蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源

蚂蚁百灵大模型系列迎来关键更新：Ling-2.6-flash 全面开放

技术亮点：混合架构与极致效率

混合线性架构：

出色的“智效比”：

场景深耕：定向增强智能体能力

相关阅读

相关下载