巨人財經 - 專業科技行業財經媒體

商湯絕影Sage端側大模型問世:以3B激活參數,開啟智能座艙新紀元

   發布時間:2026-04-22 15:01 作者:趙云飛

商湯絕影近日正式推出端側多模態智能體基座大模型Sage,這款采用MoE架構的模型總參數量達32B,但激活參數僅3B,成為全球首款在車端實現復雜智能體能力的基座大模型。通過在英偉達Orin X端側平臺的部署,Sage成功突破了傳統端側模型僅能響應簡單指令的局限,將云端級智能體能力首次落地于車載場景。

在智能座艙領域,云端依賴與端側能力不足的矛盾長期存在。云端模型雖具備復雜任務處理能力,但面臨延遲高、Token成本昂貴等問題;端側模型受限于算力與參數規模,僅能執行基礎指令交互。Sage的發布打破了這一技術僵局,其核心優勢在于通過3B激活參數實現了超越云端大模型的性能表現。在PinchBench公開評測中,Sage以94%的任務完成率領先Claude-Opus-4.6、GPT-5.4等國際主流模型,同時顯存占用僅為42B激活參數的MiMo-v2-Pro的1/31,算力消耗降低至其1/14。

這款模型的技術突破源于兩項自研后訓練技術:SCOUT分級協同學習框架與ERL可擦除強化學習。SCOUT通過"小模型探路-大模型吸收"的機制,將復雜任務學習成本降低60%,有效解決了車載場景中空間規劃、設備聯動等任務的訓練難題。ERL技術則賦予模型自我糾錯能力,可自動識別并擦除推理過程中的錯誤步驟,使復雜任務成功率提升20%。這兩項技術協同作用,推動Sage從語言模型進化為具備獨立任務閉環能力的智能體。

在專業能力維度上,Sage展現出全面領先優勢。MMLU Pro跨學科測試中取得76分,較同級端側模型提升10%;GPQA Diamond研究生級推理測試得分77分,提升幅度達33%;座艙語義與視覺理解測試以91分領先,證明其在多模態感知方面的獨特優勢。特別在τ2-bench工具調用基準上,Sage以80分實現38%的顯著提升,展現出強大的任務執行能力。

實際場景應用中,Sage實現了90%以上的場景推理精度,長鏈路工具調用成功率達92%,環境感知任務成功率94%。在Orin X平臺部署下,模型首字響應時間約0.5秒,單Token推理延遲低至0.03秒,生成吞吐達80 tk/S。這些性能指標使其能夠實時解析用戶復合指令,自動聯動空調、導航等車載系統,甚至根據乘員狀態與路況主動提供兒童模式、智能路線調整等服務。

作為智能座艙的技術基石,Sage已形成完整的生態支撐能力。該模型可無縫接入OpenClaw、Hermes等主流Agent框架,覆蓋出行、家庭等全場景應用。在北京車展期間,商湯絕影將推出搭載Sage的Sage Box硬件方案,為艙駕一體化的量產落地提供核心AI支撐,推動智能座艙從基礎交互向高階艙駕融合服務跨越。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新