商湯科技董事長兼CEO徐立博士在近期的一次行業演講中,深入剖析了當前人工智能領域的發展態勢與未來走向。他指出,人工智能的最新發展浪潮主要得益于生產方式的重大變革,具體體現在從GPT到scaling law的演進、復雜任務的精細化分解以及推理成本的顯著降低。
徐立博士強調,過去兩年中,每個token的推理成本以驚人的280倍速度下降,這一變化為人工智能的廣泛應用奠定了堅實基礎。然而,他也坦誠地指出,當前AI行業正面臨著專業思維數據稀缺的挑戰。隨著互聯網語料價值的逐漸耗盡,模型能力的提升愈發依賴于高質量的思維數據,但這類數據的獲取不僅困難且成本高昂。AI在處理長鏈條、復雜任務時,仍存在幻覺和邏輯錯誤的問題,即便是最先進的模型,其實際幻覺率也超過10%,這在嚴肅的應用環境中構成了難以忽視的障礙。
對于大模型的發展前景,徐立博士認為,2025年將是一個關鍵轉折點,原有的發展路徑已接近極限,而新的機遇正悄然浮現。他預測,未來兩年將是AI競爭的決定性時期,AI的成熟度能否突破工業紅線、成功落地生產環境并實現規模化商業閉環,將成為衡量其成功與否的重要標準。
在演講中,徐立博士還詳細闡述了商湯科技在應對這些挑戰方面的策略與布局。他強調,芯片與模型的深度聯動將是推動AI商業化閉環的關鍵。通過算法與芯片的聯合優化,國產化芯片有望迅速縮小與世界領先水平的差距。
徐立博士進一步解釋了AI研究范式的轉變。他指出,從GPT到scaling law的演進,使得人們能夠在訓練時預測不同資源投入下模型的性能,從而引發了大規模的資本投入競爭。然而,隨著這條路徑性價比的逐漸降低,人們開始發現,在推理時刻引入激勵模型能夠繼續推動測試的擴展,進而引發應用推理架構、訓推配比以及CPU、GPU和內存配比的深刻變化。
盡管如此,徐立博士也承認,這一部分的紅利很快被消耗殆盡,因為行業內能夠提供優質激勵模型的場景并不多見。因此,他預測未來AI的發展將呈現兩條分化路徑:一條是在垂直產業中尋找優質的激勵模型,形成價值閉環;另一條則是探索新的架構,以更好地利用現有數據。
在談到AI在行業應用中的滲透時,徐立博士表示,隨著生成式人工智能的興起,AI的賦能邊界得到了極大拓展,其成長速率也顯著加快。然而,這也帶來了新的挑戰,即在行業應用急速增長、滲透率快速迭代的情況下,如何實現推理的高效性成為了一個亟待解決的問題。
針對這一挑戰,徐立博士提出了AI in行業的新融合方法,強調AI與行業生產過程的緊密耦合。他認為,通過構造新的強化學習邏輯,使AI與行業生產緊密結合,能夠完成用戶價值閉環的疊加。而這一過程對AI基礎設施的建設提出了更高要求。
在演講的最后部分,徐立博士還分享了商湯科技在多模態模型研發方面的最新進展。他介紹說,商湯的日日新模型從底層解決了模態融合的問題,通過將語言、文本、圖像、視頻和3D信息融合到神經元中,實現了跨模態數據之間的聯合分布紅利。這一創新不僅提升了模型的融合度,還為AI在視頻生成、空間智能等領域的應用開辟了新的道路。






















