巨人財經 - 專業科技行業財經媒體

林俊旸離職后首談AI:千問路線遇挑戰,AI大模型轉向智能體思考新階段

   發布時間:2026-03-29 10:58 作者:沈瑾瑜

前阿里千問技術負責人林俊旸近日在離職后發布深度分析文章,提出AI大模型領域正經歷關鍵范式轉移,技術競爭焦點已從"推理型思考"轉向"智能體思考"。這一判斷基于對OpenAI o1和DeepSeek-R1等代表性模型的觀察,指出行業正從單純擴大預訓練規模,轉向強化學習后訓練階段的規模化發展,數學推理和代碼生成等可驗證領域成為模型優化的核心場景。

文章詳細拆解了"思考-指令混合模式"面臨的實踐困境。以千問團隊開發Qwen3的經驗為例,團隊發現追求低延遲的指令模型與需要消耗大量計算資源的推理模型存在根本性沖突。這種矛盾在數據分布和優化目標層面尤為突出,不當的數據融合策略往往導致模型在兩項指標上均表現不佳。基于商業客戶對處理效率和成本控制的雙重需求,Qwen2507版本最終選擇推出分離的300億參數指令模型和2350億參數推理模型。

與國內團隊的技術路徑選擇形成對比的是,Anthropic和DeepSeek等國際廠商仍在探索統一架構下的推理與工具調用融合方案。這種差異反映出不同市場環境下對模型架構的多樣化探索,既包含對技術可行性的驗證,也涉及商業落地的權衡考量。

對于技術演進方向,林俊旸強調傳統通過延長推理鏈提升性能的方法即將觸及天花板,未來主流將是具備環境交互能力的智能體架構。這種轉變要求重新構建技術棧,實現訓練與推理環節的深度解耦。隨著模型逐步接入搜索引擎、代碼執行器等外部工具,如何防范獎勵函數被惡意利用成為關鍵安全挑戰。他特別指出,行業競爭優勢將不再局限于算法創新,而是轉向環境構建、安全協議設計以及多智能體協作等系統性工程能力建設。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新