首页 > 教程攻略 > ai资讯 >蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源

蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源

来源:互联网 时间:2026-06-20 15:59:07

蚂蚁百灵大模型系列迎来关键更新:Ling-2.6-flash 全面开放

蚂蚁集团旗下的百灵大模型系列,今天有个值得关注的新动态:Ling-2.6-flash模型正式向全球开发者敞开了大门。为了应对不同的硬件环境和切实降低部署门槛,这次更新同步带来了BF16、FP8以及INT4等多个精度版本。目的很明确,就是给开发者提供更灵活、更具弹性的推理选择。

这款模型的总参数量达到了104B,而激活参数量为7.4B,属于Instruct模型。有意思的是,在正式官宣之前,它曾以“Elephant Alpha”这个匿名身份,在OpenRouter平台上悄悄进行了为期两周的试运行。这段“实战测试”收获了大量来自真实场景的反馈,研发团队据此进行了针对性优化。结果是?模型在中英文自然切换的流畅度上显著增强,在主流编程框架中的适配表现也更加出色了。

image.png

技术亮点:混合架构与极致效率

说到Ling-2.6-flash的核心竞争力,离不开其独特的架构设计和令人印象深刻的运行效率:

  • 混合线性架构:

    通过底层的计算优化,模型的推理速度表现极佳。在4卡H20的环境下,最高推理速度能达到340 tokens/s。更值得一提的是其Prefill(预填充)吞吐量,达到了Nemotron-3-Super的2.2倍,这对于大幅缩短响应延迟至关重要。

  • 出色的“智效比”:

    研发团队在训练阶段对Token效率进行了深度校准。评测数据揭示了一个关键优势:完成同等质量的任务,Ling-2.6-flash仅需消耗约15M tokens。这个数值大约只是同类竞品的十分之一,意味着商用成本得到了极大程度的控制。

场景深耕:定向增强智能体能力

当前大模型最火热的应用场景之一莫过于Agent(智能体),而Ling-2.6-flash对此进行了专项强化。无论是复杂的工具调用、需要逻辑的多步规划,还是最终的任务执行,模型的表现都相当稳健。在BFCL-V4、SWE-bench等一系列行业主流评测中,即便面对激活参数规模更大的对手,它依然能保持相近甚至达到行业顶尖(SOTA)的水平。

目前,开发者已经可以通过Hugging Face和ModelScope(魔搭社区)获取该模型的开源资源。这无疑为探索其在各行业应用中的潜力,铺平了道路。