蚂蚁集团百灵大模型系列更新 Ling-2.6-flash正式开源
来源:互联网
时间:2026-06-20 15:59:07
蚂蚁百灵大模型系列迎来关键更新:Ling-2.6-flash 全面开放
蚂蚁集团旗下的百灵大模型系列,今天有个值得关注的新动态:
这款模型的总参数量达到了104B,而激活参数量为7.4B,属于Instruct模型。有意思的是,在正式官宣之前,它曾以“Elephant Alpha”这个匿名身份,在OpenRouter平台上悄悄进行了为期两周的试运行。这段“实战测试”收获了大量来自真实场景的反馈,研发团队据此进行了针对性优化。结果是?模型在中英文自然切换的流畅度上显著增强,在主流编程框架中的适配表现也更加出色了。

技术亮点:混合架构与极致效率
说到
- 通过底层的计算优化,模型的推理速度表现极佳。在4卡H20的环境下,最高推理速度能达到340 tokens/s。更值得一提的是其Prefill(预填充)吞吐量,达到了Nemotron-3-Super的2.2倍,这对于大幅缩短响应延迟至关重要。
混合线性架构:
- 研发团队在训练阶段对Token效率进行了深度校准。评测数据揭示了一个关键优势:完成同等质量的任务,
出色的“智效比”:
仅需消耗约15M tokens。这个数值大约只是同类竞品的十分之一,意味着商用成本得到了极大程度的控制。Ling-2.6-flash
场景深耕:定向增强智能体能力
当前大模型最火热的应用场景之一莫过于Agent(智能体),而
目前,开发者已经可以通过Hugging Face和ModelScope(魔搭社区)获取该模型的开源资源。这无疑为探索其在各行业应用中的潜力,铺平了道路。