商汤绝影Sage端侧大模型问世：以3B激活参数，开启智能座舱新纪元-汽车-沃资讯

商汤绝影近日正式推出端侧多模态智能体基座大模型Sage，这款采用MoE架构的模型总参数量达32B，但激活参数仅3B，成为全球首款在车端实现复杂智能体能力的基座大模型。通过在英伟达Orin X端侧平台的部署，Sage成功突破了传统端侧模型仅能响应简单指令的局限，将云端级智能体能力首次落地于车载场景。

在智能座舱领域，云端依赖与端侧能力不足的矛盾长期存在。云端模型虽具备复杂任务处理能力，但面临延迟高、Token成本昂贵等问题；端侧模型受限于算力与参数规模，仅能执行基础指令交互。Sage的发布打破了这一技术僵局，其核心优势在于通过3B激活参数实现了超越云端大模型的性能表现。在PinchBench公开评测中，Sage以94%的任务完成率领先Claude-Opus-4.6、GPT-5.4等国际主流模型，同时显存占用仅为42B激活参数的MiMo-v2-Pro的1/31，算力消耗降低至其1/14。

这款模型的技术突破源于两项自研后训练技术：SCOUT分级协同学习框架与ERL可擦除强化学习。SCOUT通过"小模型探路-大模型吸收"的机制，将复杂任务学习成本降低60%，有效解决了车载场景中空间规划、设备联动等任务的训练难题。ERL技术则赋予模型自我纠错能力，可自动识别并擦除推理过程中的错误步骤，使复杂任务成功率提升20%。这两项技术协同作用，推动Sage从语言模型进化为具备独立任务闭环能力的智能体。

在专业能力维度上，Sage展现出全面领先优势。MMLU Pro跨学科测试中取得76分，较同级端侧模型提升10%；GPQA Diamond研究生级推理测试得分77分，提升幅度达33%；座舱语义与视觉理解测试以91分领先，证明其在多模态感知方面的独特优势。特别在τ2-bench工具调用基准上，Sage以80分实现38%的显著提升，展现出强大的任务执行能力。

实际场景应用中，Sage实现了90%以上的场景推理精度，长链路工具调用成功率达92%，环境感知任务成功率94%。在Orin X平台部署下，模型首字响应时间约0.5秒，单Token推理延迟低至0.03秒，生成吞吐达80 tk/S。这些性能指标使其能够实时解析用户复合指令，自动联动空调、导航等车载系统，甚至根据乘员状态与路况主动提供儿童模式、智能路线调整等服务。

作为智能座舱的技术基石，Sage已形成完整的生态支撑能力。该模型可无缝接入OpenClaw、Hermes等主流Agent框架，覆盖出行、家庭等全场景应用。在北京车展期间，商汤绝影将推出搭载Sage的Sage Box硬件方案，为舱驾一体化的量产落地提供核心AI支撑，推动智能座舱从基础交互向高阶舱驾融合服务跨越。