商汤科技开源日日新 SenseNova U1,实现多模态原生统一架构
来源:互联网
时间:2026-06-20 15:59:46
商汤科技在28日正式发布并开源了“日日新 SenseNova U1”系列模型。这可不是一次简单的版本迭代,它背后所代表的,是多模态AI技术路线的一次关键转向——从过去“拼装组合”式的集成方案,迈向了“原生统一”的新范式。
这次发布的核心,是商汤在今年3月自主研发的NEO-unify架构。SenseNova U1正是基于此架构构建。它与主流设计思路截然不同,干脆去掉了视觉编码器和变分自编码器这些传统组件,转而重构了一个统一的表征空间。简单来说,它不再把文字和图像当成需要先分开处理、再勉强拼接的两样东西,而是从底层就将它们视为一个复合整体进行建模。
这种深度统一带来的好处是显而易见的。一方面,模型能更好地保留语义的丰富层次;另一方面,它又维持了像素级的视觉保真度。反映在能力上,就是模型在需要复杂逻辑推理和精细空间关系的任务上,表现出了显著优势。它能够精准理解物理世界中物体之间的布局与关联,这种能力,正是通向更高级智能的基石。
话说回来,这次开源的战略意图也相当清晰。随着具身智能成为明确的趋势,商汤显然在为未来布局。他们计划将U1模型打造为机器人的“具身大脑”,理想状态下,在一个单一的模型闭环内,就能完成从感知环境、逻辑推演到最终执行任务的全链条。这无疑是对现有技术框架的一次大胆简化与整合。
所以,此次开源行动的意义,远不止是公开一套代码。它实际上是为行业提供了一个关键的底层技术引擎,同时也预示了一个方向:AI模型正在向更高集成度、更强泛化能力的通用架构加速演进。未来的竞争,或许将更集中于这类原生、统一的底层框架之上。