商汤科技发布开源空间智能模型超越GPT

11月11日消息,商汤推出SenseNova-SI系列新型号,并开源。报告称,SenseNova-SI在多项空间推理和理解评估任务中均优于GPT-5、Gemini 2.5 Pro等国际闭源模型。据悉,开源的SenseNova-SI空间智能大型模型系列包括2B和8B两种规格。根据最新评测数据,SenseNova-SI系列模型在多项空间智能基准测试(VSI、MMSI、MindCube、ViewSpatial)中表现出以下表现。其中,SenseNova-SI-8B模型在四项基础评测中取得平均分60.99分,领先Qwen3-VL-8B(40.16)、BAGEL-7B等开源通用多模态模型。 (35.01),专门的空间智能模型如 SpatialMLLM (35.05) 和 ViLaSR-7B (36.41) 也优于闭源模型如 GPT-5 (49.68) 和 Gemini-2.5-Pro (48).81) 具有相对较轻的型号规格。资料显示,SenseNova-SI是基于商汤科技提出的空间能力分类系统以及过去各种数据的积累。研究团队采用系统方法缩放空间理解数据,并首次研究了空间智能领域的“尺度效应”。这意味着您可以通过大规模、高质量数据的训练来显着提高模型的空间认知能力。商汤科技提出的训练范式具有通用性,可以针对不同架构的基础模型(例如InternVL)进行有效改进,以在空间智能的六个核心维度:空间测量、空间重建、空间关系、透视变换、空间变形和空间推理方面实现一致的性能提升。据介绍,此次LiliSenseNova-SI大规模空间智能模型将完成创新“启蒙”世界模型,更好地解决多模态模型从数字空间走向物理世界的根本挑战,进一步推动人工智能未来在自动驾驶、机器人等场景的应用。 (定西)本文来自网易科技报道。关注我们以获取更多信息和深入内容。

admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注