巨人財經 - 專業科技行業財經媒體

阿里巴巴Qwen3.5-Plus發布:以架構革新與多模態能力,開啟開源智能新紀元

   發布時間:2026-02-17 00:11 作者:孫明

阿里巴巴在人工智能領域再掀波瀾,正式推出新一代基座大模型千問Qwen3.5-Plus,其旗艦版本Qwen3.5-397B-A17B以顛覆性技術架構引發全球關注。這款模型不僅在性能指標上與谷歌Gemini 3 Pro、OpenAI GPT-5.2等國際頂尖模型正面交鋒,更通過創新的參數激活機制和原生多模態能力,重新定義了開源大模型的技術邊界。

Qwen3.5-Plus的核心突破在于其"以小搏大"的參數激活策略。模型總參數達3970億,但單次推理僅需激活170億參數,通過自研門控技術與稀疏混合專家(MoE)架構的深度融合,實現了計算效率的質的飛躍。這種設計使顯存占用較前代萬億參數模型降低60%,在32K上下文場景中推理吞吐量提升8.6倍,256K超長上下文場景下更達到19倍提升。技術團隊通過優化注意力機制,將首token注意力占比從46.7%降至4.8%,最大激活值從1053降至94,顯著增強了訓練穩定性。

模型架構的革新體現在線性注意力機制與稀疏MoE架構的有機整合。傳統Transformer架構處理長文本時需進行全量注意力計算,導致計算復雜度呈平方級增長。Qwen3.5-Plus通過動態分配注意力資源,對關鍵信息精讀、冗余信息略讀,將計算復雜度降至線性級別。更引人注目的是其"思維模式"雙軌機制:日常對話采用非思維模式實現毫秒級響應,復雜任務則自動切換至長鏈條思維模式,通過內部思考鏈生成提升答案準確性。用戶還可根據任務需求動態分配"思維預算",這種靈活的計算資源調度使AI具備策略性決策能力。

原生多模態能力是Qwen3.5-Plus的另一大殺手锏。不同于傳統模型將視覺模塊作為附加組件,該模型從預訓練階段就實現視覺與文本的深度融合。在視覺處理方面,模型可直接解析手繪界面草圖生成前端代碼,或通過UI截圖定位代碼漏洞并提供修復建議。視頻理解能力支持長達2小時的連續輸入,在物理空間推理評測中展現出超越專用視覺模型的幾何作圖精度和任務規劃能力。這些特性使其在具身智能領域具有廣闊應用前景,可為工業機器人和家用助理提供頂層感知決策核心。

商業層面的顛覆性體現在其極具競爭力的定價策略。Qwen3.5-Plus的API調用價格每百萬token僅0.8元人民幣,不足Gemini 3 Pro的1/18。這種"智能廉價化"策略正在重塑全球AI市場格局。目前,阿里巴巴開源模型庫已包含超過400個全尺寸、全模態模型,全球下載量突破10億次,衍生模型超過20萬個,形成全球最活躍的開源生態。在語言支持方面,模型覆蓋201種語言和方言,詞表容量從15萬擴展至25萬,顯著提升了非洲、南亞及中國少數民族語言的編碼效率。

這場技術革命背后,是阿里巴巴對AGI發展路徑的深刻思考。通過架構創新打破算力桎梏,通過多模態融合賦予AI真實世界行動力,最終通過開源生態實現智能資源的普惠化。Qwen3.5-Plus的發布標志著全球AI競爭從"參數規模"轉向"架構效能"的新階段,開源模型不再僅僅是追趕者,而是成為技術演進的新標桿。隨著社區生態的持續完善,這款模型有望成為企業級本地化部署的首選底座,推動智能技術像水電一樣融入社會生產生活的每個角落。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新