沃资讯
科技 财经 汽车 游戏 数码 资讯 商业

商汤绝影Sage端侧大模型问世:以3B激活参数,开启智能座舱新纪元

2026-04-22来源:互联网编辑:瑞雪

商汤绝影近日正式推出端侧多模态智能体基座大模型Sage,这款采用MoE架构的模型总参数量达32B,但激活参数仅3B,成为全球首款在车端实现复杂智能体能力的基座大模型。通过在英伟达Orin X端侧平台的部署,Sage成功突破了传统端侧模型仅能响应简单指令的局限,将云端级智能体能力首次落地于车载场景。

在智能座舱领域,云端依赖与端侧能力不足的矛盾长期存在。云端模型虽具备复杂任务处理能力,但面临延迟高、Token成本昂贵等问题;端侧模型受限于算力与参数规模,仅能执行基础指令交互。Sage的发布打破了这一技术僵局,其核心优势在于通过3B激活参数实现了超越云端大模型的性能表现。在PinchBench公开评测中,Sage以94%的任务完成率领先Claude-Opus-4.6、GPT-5.4等国际主流模型,同时显存占用仅为42B激活参数的MiMo-v2-Pro的1/31,算力消耗降低至其1/14。

这款模型的技术突破源于两项自研后训练技术:SCOUT分级协同学习框架与ERL可擦除强化学习。SCOUT通过"小模型探路-大模型吸收"的机制,将复杂任务学习成本降低60%,有效解决了车载场景中空间规划、设备联动等任务的训练难题。ERL技术则赋予模型自我纠错能力,可自动识别并擦除推理过程中的错误步骤,使复杂任务成功率提升20%。这两项技术协同作用,推动Sage从语言模型进化为具备独立任务闭环能力的智能体。

在专业能力维度上,Sage展现出全面领先优势。MMLU Pro跨学科测试中取得76分,较同级端侧模型提升10%;GPQA Diamond研究生级推理测试得分77分,提升幅度达33%;座舱语义与视觉理解测试以91分领先,证明其在多模态感知方面的独特优势。特别在τ2-bench工具调用基准上,Sage以80分实现38%的显著提升,展现出强大的任务执行能力。

实际场景应用中,Sage实现了90%以上的场景推理精度,长链路工具调用成功率达92%,环境感知任务成功率94%。在Orin X平台部署下,模型首字响应时间约0.5秒,单Token推理延迟低至0.03秒,生成吞吐达80 tk/S。这些性能指标使其能够实时解析用户复合指令,自动联动空调、导航等车载系统,甚至根据乘员状态与路况主动提供儿童模式、智能路线调整等服务。

作为智能座舱的技术基石,Sage已形成完整的生态支撑能力。该模型可无缝接入OpenClaw、Hermes等主流Agent框架,覆盖出行、家庭等全场景应用。在北京车展期间,商汤绝影将推出搭载Sage的Sage Box硬件方案,为舱驾一体化的量产落地提供核心AI支撑,推动智能座舱从基础交互向高阶舱驾融合服务跨越。

谷歌深夜发力更新Deep Research智能体,MCP加持与图表生成开启新篇
这两款智能体首次允许开发者通过单次API调用,将开放网络数据与企业专有信息进行融合,并在研究报告中原生生成图表和信息图,同时还可通过ModelContext Protocol(MCP)连接任意第三方数据源…

2026-04-22

SOLAI发布Solode Neo:N150迷你主机搭载AI系统 3分钟接入多款主流模型
IT之家 4 月 22 日消息,企业 SOLAI 美国当地时间 21 日宣布推出自主 AI 智能体专用私人终端设备 Solode Neo,早鸟价369 美元(IT之家注:现汇率约合 2523 元人民币)。 …

2026-04-22