SenseNova 6.7 Flash-Lite - 商汤推出的多模态智能体模型
来源:互联网
时间:2026-06-13 14:56:24
SenseNova 6.7 Flash-Lite是什么
在AI模型追求更大、更强的趋势下,商汤科技反其道而行,推出了SenseNova 6.7 Flash-Lite。这并非一次简单的参数精简,而是一款专为真实世界工作流设计的轻量化多模态智能体模型。它的核心在于“原生多模态”架构,能够直接“看懂”复杂的网页布局、文档结构乃至财务图表,实现了从“看到”到“想到”再到“做到”的一体化闭环。更直观地说,在处理信息搜索这类任务时,它的Token消耗相比纯文本智能体直接降低了60%,同时在多项权威基准测试中达到了同级别的最优水平。
SenseNova 6.7 Flash-Lite的主要功能
- :模型能直接解析网页、文档和图表中的视觉信息,无需经过“视觉转文本”这一中间步骤,避免了信息在转换过程中的损耗。
原生多模态理解
- :它擅长处理需要多步骤协作的复杂任务,例如从原始数据出发,完成分析、调研,最终生成一份结构完整的PPT报告,实现端到端的交付。
长链路任务执行
- :原生集成了商汤的SenseNova-Skills体系,这意味着它可以无缝调用信息图生成、PPT创作、Excel分析等一系列办公场景下的专用技能。
智能体技能调用
- :得益于去掉了视觉转译层,在信息搜索等典型场景中,其Token消耗可比纯文本智能体降低高达60%,直接带来成本效益的提升。
低Token消耗推理
- :虽然参数量更轻,但推理速度极快,能够满足高频、高并发的互动式生产环境需求。
毫秒级高频响应
SenseNova 6.7 Flash-Lite的技术原理
- :技术上的关键突破在于摒弃了传统的“语言模型+视觉模块”简单拼接模式。其视觉模块深度参与到核心决策与推理循环中,而不仅仅是作为文本的补充说明。
原生多模态架构
- :模型设计之初就瞄准了完整的工作流,能够自动化执行从数据处理、分析、可视化,到形成结论和提出建议的全链路任务。
端到端工作流闭环
- :面对深度调研等复杂场景,模型具备自主检索、对比多源数据的能力,并能从中准确提取关键逻辑,最终生成可视化的交付成果。
抗噪环境感知
如何使用SenseNova 6.7 Flash-Lite
- :首先需要进入商汤的日日新大模型平台官网进行注册,并申请相应的Token Plan。
访问官网
- :新用户可领取每5小时1500次调用的免费API配额,并创建自己的API Key。
获取额度
- :通过官方提供的GitHub仓库,可以一键部署Hermes Agent或OpenClaw框架,并集成全套Skills插件,实现快速上手。
安装Agent Pack
- :如果希望使用其他Agent框架,也可以从开源仓库中单独获取所需的SenseNova-Skills组件进行集成。
自主集成
- :完成上述步骤后,即可通过API或集成的Agent框架接入模型,开始执行数据分析、PPT生成等具体任务。
开始调用
SenseNova 6.7 Flash-Lite的关键信息和使用要求
- :商汤日日新 SenseNova 6.7 Flash-Lite
产品名称
- :商汤科技(SenseTime)
开发团队
- :轻量化原生多模态智能体模型
模型类型
- :网页/文档/图表直接解析、长链路任务闭环、毫秒级响应
核心能力
- :Token Plan首月为每模型提供每5小时1500次的调用额度
免费政策
- :相关技能(SenseNova-Skills)和一站式部署包(Agent Pack)均在GitHub开源
开源生态
- :官方主要支持Hermes Agent和OpenClaw框架
支持框架
SenseNova 6.7 Flash-Lite的核心优势
- :Token消耗的显著下降意味着在同等成本下,可以完成更多的工作量,产出效率更高。
成本大幅降低
- :视觉信息直接参与推理,避免了传统方式中“转译-理解”两步走带来的信息偏差和丢失。
多模态深度融合
- :毫秒级的响应速度使其能够真正融入高频、实时的办公自动化流程,而非仅用于演示。
生产级性能
- :结合免费的初始额度和完全开源的工具链,用户几乎可以零成本快速验证并接入实际业务。
开箱即用生态
SenseNova 6.7 Flash-Lite的项目地址
- :可在商汤日日新平台查看模型详情。
项目官网
- :模型及相关组件的代码与资源已在GitHub开源。
GitHub仓库
SenseNova 6.7 Flash-Lite的同类竞品对比
| 对比维度 | SenseNova 6.7 Flash-Lite | GLM-5 | GPT-5.4 |
|---|---|---|---|
| 架构设计 | 原生多模态,视觉直参推理 | 传统多模态拼接 | 传统多模态拼接 |
| Token成本 | 信息搜索场景降低60% | 标准消耗 | 标准消耗 |
| 智能体能力(PinchBench) | 92分 | 85.3分 | 90.5分 |
| PPT生成(NovaPPTBench) | 90.7分 | 87分 | 87.6分 |
| 数学推理(MathVision) | 85.5分 | 72.1分 | 84.2分 |
| 办公技能生态 | SenseNova-Skills全开源 | 部分开源 | 闭源 |
| 免费额度 | 每5小时1500次 | 有限免费/付费 | 有限免费/付费 |
SenseNova 6.7 Flash-Lite的应用场景
- :自动处理海量的销售数据或财务报表,快速生成包含洞察和可视化图表的运营分析报告,为决策提供支持。
企业数据分析
- :能够自主编排任务,完成从信息搜集、数据对比到章节撰写的完整行业研究报告,并自动生成配套的数据图表。
行业深度调研
- :覆盖PPT、信息图、Excel分析等高频率办公需求,实现一键式内容生成与美化,提升日常工作效率。
办公自动化
- :为老年人、青少年等需要更直观指引的群体,生成图文并茂、步骤清晰的办事流程或健康就诊指南。
公共服务指引