商湯絕影Sage端側大模型問世：以3B激活參數，開啟智能座艙新紀元

發布時間：2026-04-22 15:01 來源：互聯網作者：趙云飛

商湯絕影近日正式推出端側多模態智能體基座大模型Sage，這款采用MoE架構的模型總參數量達32B，但激活參數僅3B，成為全球首款在車端實現復雜智能體能力的基座大模型。通過在英偉達Orin X端側平臺的部署，Sage成功突破了傳統端側模型僅能響應簡單指令的局限，將云端級智能體能力首次落地于車載場景。

在智能座艙領域，云端依賴與端側能力不足的矛盾長期存在。云端模型雖具備復雜任務處理能力，但面臨延遲高、Token成本昂貴等問題；端側模型受限于算力與參數規模，僅能執行基礎指令交互。Sage的發布打破了這一技術僵局，其核心優勢在于通過3B激活參數實現了超越云端大模型的性能表現。在PinchBench公開評測中，Sage以94%的任務完成率領先Claude-Opus-4.6、GPT-5.4等國際主流模型，同時顯存占用僅為42B激活參數的MiMo-v2-Pro的1/31，算力消耗降低至其1/14。

這款模型的技術突破源于兩項自研后訓練技術：SCOUT分級協同學習框架與ERL可擦除強化學習。SCOUT通過"小模型探路-大模型吸收"的機制，將復雜任務學習成本降低60%，有效解決了車載場景中空間規劃、設備聯動等任務的訓練難題。ERL技術則賦予模型自我糾錯能力，可自動識別并擦除推理過程中的錯誤步驟，使復雜任務成功率提升20%。這兩項技術協同作用，推動Sage從語言模型進化為具備獨立任務閉環能力的智能體。

在專業能力維度上，Sage展現出全面領先優勢。MMLU Pro跨學科測試中取得76分，較同級端側模型提升10%；GPQA Diamond研究生級推理測試得分77分，提升幅度達33%；座艙語義與視覺理解測試以91分領先，證明其在多模態感知方面的獨特優勢。特別在τ2-bench工具調用基準上，Sage以80分實現38%的顯著提升，展現出強大的任務執行能力。

實際場景應用中，Sage實現了90%以上的場景推理精度，長鏈路工具調用成功率達92%，環境感知任務成功率94%。在Orin X平臺部署下，模型首字響應時間約0.5秒，單Token推理延遲低至0.03秒，生成吞吐達80 tk/S。這些性能指標使其能夠實時解析用戶復合指令，自動聯動空調、導航等車載系統，甚至根據乘員狀態與路況主動提供兒童模式、智能路線調整等服務。

作為智能座艙的技術基石，Sage已形成完整的生態支撐能力。該模型可無縫接入OpenClaw、Hermes等主流Agent框架，覆蓋出行、家庭等全場景應用。在北京車展期間，商湯絕影將推出搭載Sage的Sage Box硬件方案，為艙駕一體化的量產落地提供核心AI支撐，推動智能座艙從基礎交互向高階艙駕融合服務跨越。

更多>同類內容