
28日,商汤科技认真发布并开源日日新SenseNova U1系列原生相识生成和洽模子。它基于商汤于本年三月自主研发的 NEO-unify架构,在单一模子架构上和洽了多模态相识、推理与生成。

SenseNova U1在业内初次达成结伙性的图文创作输出 受访者 供图
龙虎斗2026世界杯官方最新网址SenseNova U1系列模子大概将言语与视觉信息四肢和洽的复合体径直建模,达成言语和视觉信息的高效协同,让相识与生成能力同步增强,在保留语义丰富度的同期,保管像素级的视觉保真度。
在逻辑推理与空间智能等方朝上,它大概深度相识物理宇宙的复杂布局与综合相关;在异日,它还能为机器东谈主提供具身大脑,达成在单一模子闭环内完成从复杂环境感知、逻辑推演到精确任务膨胀的全历程。
效用,是和洽模子架构的中枢技艺上风。传统多模态模子是把视觉编码器和言语主干通过适配器拼接在沿途的。它像一个“说不同言语的东谈主构成的职责组”:有东谈主特意看图,把图像翻译为言语,有东谈主特意相识翰墨,进行推理,有东谈主把适度再翻译为蓄意请示,把丹青出来。每完成一次任务,信息皆要在不同成员之间往复传递。这个历程天然可行,AG真人国际·(中国)官方网站但不免会有恭候、诬蔑和信息损耗。为了弥补这些损耗,模子频频需要作念得更大才能达到好的恶果。
SenseNova U1是基于和洽表征空间构建的,更像是一个从一运行就同期掌捏多项技巧的东谈主。它不是先看懂图像、再翻译成翰墨、再交给另一个系统相识,而是在兼并套“念念考模样”里径直惩处图像、翰墨等不同信息。图像和言语不再是两套系统之间的艰巨,而是在兼并个大脑中天然会通。这么带来的平允是:信息流转更快捷,相识更径直,生成更高效。模子不需要依赖单纯堆大参数来弥补中间养息的损耗,而是通过和洽的里面表征,把不同模态的信息以更紧凑、更高密度的模样组织起来。
简便来说,传统架构像是“多东谈主贯串、层层转述”;SenseNova U1 更像是“一个万能大脑,径直相识,径直抒发”。少了中间转译,信息损耗更低,也能在相对更精简的模子限制下,达成更强的多模态相识与生成能力。
在涵盖图像相识、图像生成与裁剪、空间智能和视觉推理的多项基准测试中,SenseNova U1 Lite均达到同量级开源模子SOTA水平,为和洽多模态相识与生成缔造了新的标杆。致使仅凭8B-MoT的较小规格,就能达到致使格外部分大型交易闭源模子。
南边+记者 郜小平AG真人国际·(中国)官方网站
