巨人財經 - 專業科技行業財經媒體

商湯徐立:大模型發展迎新契機,未來兩年AI競爭聚焦成熟度與商業閉環

   發布時間:2026-01-31 01:38 作者:任飛揚

商湯科技董事長兼CEO徐立博士在近期一場重要演講中,深入剖析了人工智能領域當前面臨的變革與機遇。他指出,人工智能正步入一個全新發展階段,生產方式的轉變成為推動這一波浪潮的關鍵因素,主要體現在從GPT到Scaling Law的演進、復雜任務的分解以及推理成本的急劇下降。

徐立博士詳細解釋了Scaling Law的精髓,即在訓練過程中,通過資源投入可以預測不同規模下人工智能模型的性能表現。這一規律使得大量資源涌入,推動了人工智能領域的快速發展。然而,隨著性價比逐漸降低,人們開始探索新的路徑。徐立博士提到,在推理階段引入激勵模型,為測試的Scaling提供了新的延伸方向,同時也引發了應用推理架構、CPU與GPU配比以及內存配比等方面的變化。

面對行業內的挑戰,徐立博士認為,未來人工智能的發展將呈現兩條分化路徑。一方面,垂直產業將尋找優質的激勵模型,形成價值閉環,實現場景的深度切入;另一方面,探索新的架構以更好地利用現有數據將成為重要方向。他強調,人工智能進入產業應用的關鍵在于能否超越人類水平,而當前已有大量任務在垂直領域遠超人類表現。

在談到任務分解時,徐立博士指出,長程任務的分解能力正在以驚人的速度增長,這得益于任務復雜度的摩爾定律。這一趨勢使得人類能夠解決更多復雜問題,推動現實生活的進步。同時,推理成本的急劇下降也是推動人工智能普及的重要因素。徐立博士透露,過去兩年中,每個token的成本以280倍的速度下降,這一變化將帶來行業的巨量變革。

然而,徐立博士也指出了人工智能在行業應用中面臨的挑戰。他提到,模型可靠性、專業思維鏈數據稀缺以及空間智能理解不足等問題亟待解決。特別是在處理長鏈條、復雜工作時,模型容易出現幻覺和邏輯錯誤,導致在嚴肅應用環境中無法依賴。新訓練框架和模型框架的引入也帶來了推理成本高企的問題。

為了應對這些挑戰,徐立博士提出了商湯科技的解決方案。他強調,商湯科技正致力于從底層解決模態融合問題,訓練融合度最高的多模態模型。通過將語言、文本、圖像、視頻和3D等要素融入神經元結構,商湯科技實現了跨模態數據之間的聯合分布,挖掘了不同數據之間的額外信息量。這一創新不僅提升了模型的性能,還為行業應用提供了更多可能性。

徐立博士還分享了商湯科技在具身世界模型方面的研究成果。他提到,商湯科技開源了面向智駕和機器人的具身世界模型,通過模擬生成世界模型來驅動具身本體。這一成果在機械臂拼搭積木等任務中得到了驗證,展示了模型對空間智能的深刻理解。商湯科技還將其能力應用于視頻生成領域,實現了跨多個攝像頭之間的切鏡和時空一致性,為創作者提供了更多創意空間。

在談到推理成本時,徐立博士指出,芯片與模型的深度聯合優化是降低推理成本的關鍵。他提到,商湯科技通過架構優化和專注推理任務,使得國產GPU芯片在視頻生成等任務中能夠與國際頂尖GPU芯片相媲美。這一成果不僅縮短了國產芯片與國際前沿的差距,還為行業應用提供了更具性價比的解決方案。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新