Sage – 商汤绝影推出的端侧多模态智能体基座大模型
在智能汽车领域,一个长期存在的矛盾是:我们既渴望云端大模型那种强大的理解和推理能力,又受限于车端有限的算力和必须保障的实时响应。这个“鱼与熊掌”的难题,如今似乎有了一个颇具说服力的答案——商汤绝影推出的端侧多模态智能体基座大模型 Sage。
简单来说,Sage 是一款专门为汽车打造的、能在车机本地运行的“大脑”。它采用了一种名为 MoE(专家混合)的先进架构,总参数量达到 320亿,但在实际推理时,每次只激活其中的 30亿参数。这种“大仓库、小出口”的设计,让它既具备了处理复杂任务的知识储备,又保证了在英伟达 Orin X 这类车规级芯片上的运行效率。最引人注目的是其性能:在衡量智能体任务完成率的 PinchBench 评测中,Sage 取得了 94% 的惊人成绩,甚至超越了 Claude-Opus-4.6、GPT-5.4 等一众需要联网的云端旗舰模型。这背后,离不开其搭载的 SCOUT 与 ERL 两项独家后训练技术,它们共同赋予了 Sage 解析复合指令、联动多系统、主动感知环境的核心能力。
Sage的主要功能:从被动响应到主动服务
那么,这颗“端侧大脑”具体能做什么?它远不止是一个升级版的语音助手。
首先,是理解复杂人话的能力。
其次,是有了“眼睛”和“预感”。
再者,是真正的执行与推理能力。
最后,是所有体验的基石:即时响应。
技术内核:如何用更少的资源,办更大的事?
Sage 令人印象深刻的性能表现,根植于几项关键的技术创新。
核心架构是高效的 MoE。
训练阶段有“侦察兵”SCOUT。
推理过程有“橡皮擦”ERL。
此外,是一体化的多模态理解。
关键信息速览
- MoE架构,总参数320亿,激活参数30亿。
模型架构:
- 已在英伟达 Orin X 端侧平台实现部署验证。
部署平台:
- PinchBench 任务完成率 94%,超越多个主流云端模型。
性能标杆:
- 已在近期北京车展期间推出搭载 Sage 的 SageBox 硬件产品。
硬件载体:
- 主要面向寻求高端智能化的车企、Tier 1 供应商及端侧智能体开发者。
目标用户:
- 纯端侧运行,无需云端网络连接,保障隐私与稳定性。
网络要求:
- 支持接入 OpenClaw、Hermes 等主流智能体开发框架。
生态兼容:
Sage的核心优势:不止于参数的游戏
在参数竞赛白热化的今天,Sage 选择了一条更务实的路径,其优势也体现在多个维度。
第一,是极致的性能效率比。
第二,是全链路的成本优化。
第三,是深厚的场景化理解。
第四,也是最重要的,是明确的量产可行性。
横向对比:在端侧赛道中处于什么位置?
| 对比维度 | Sage | Google Gemma 4 | MiMo-v2-Pro |
|---|---|---|---|
| 发布方 | 商汤绝影 | 小米 | |
| 总参数量 | 32B | 同量级端侧 | 超1T |
| 激活参数量 | 3B | 未披露 | 42B |
| PinchBench完成率 | 94% |
83.9% | 87.4% |
| MMLU Pro | 75.8 |
69.2 | – |
| GPQA Diamond | 77.3 |
58.5 | – |
| τ2-bench | 80.7 |
42.1 | – |
| Human Semantic Understanding | 91.5 |
69.5 | – |
| 部署平台 | 英伟达Orin X | 端侧 | 端侧 |
| 核心定位 | 端侧智能体基座 | 端侧通用模型 | 端侧推理模型 |
从对比中不难看出,Sage 在多项关键评测中均领先于同赛道选手,尤其是在体现袋里能力的 τ2-bench 和体现车载场景理解能力的 Human Semantic Understanding 测试中优势明显。这清晰地表明了其“为车而生,为智能体任务而优化”的差异化定位。
未来已来:Sage将如何改变车内体验?
基于上述能力,Sage 正在开启几个全新的智能座舱应用场景:
自然流式的多轮交互:
主动式安全与关怀:
全局智能出行规划:
舱驾融合的桥梁:
总而言之,Sage 的出现,标志着端侧大模型从“能不能用”进入了“好不好用、聪不聪明”的新阶段。它通过一系列精巧的技术设计,在有限的端侧资源内,实现了接近甚至超越云端模型的智能体能力,为下一代智能汽车的体验竞争,划定了一条新的起跑线。