巨人財經 - 專業科技行業財經媒體

阿里Qwen3.5馬年首發三款中型模型,35B以小博大,開發者成本直降

   發布時間:2026-02-26 00:10 作者:孫明

阿里近日正式推出Qwen3.5中型模型系列,包括Qwen3.5-122B-A10B、Qwen3.5-35B-A3B和Qwen3.5-27B(Dense)三款開源模型,同時Qwen3.5-Flash(基于35B-A3B的生產版本)API已在阿里云百煉平臺上線。這一系列模型的發布,標志著阿里在大模型領域持續發力,進一步縮小了中型模型與前沿模型的差距。

在12項核心能力測評中,Qwen3.5系列模型在通用推理、數學、智能體和多模態等多個維度展現出強勁實力,整體表現可與國際一流模型如GPT-5 mini和Claude Sonnet 4.5相媲美。其中,Qwen3.5-35B-A3B尤為引人注目,其性能超越了參數規模大數倍的Qwen3-235B-A22B-2507和Qwen3-VL-235B-A22B,證明了架構優化和數據質量的重要性。

開發者社區對這一系列模型給予了高度評價。多位開發者指出,這些模型尺寸適中,非常適合本地推理,實現了“更小模型、更強性能”的目標。有開發者估算,使用Qwen3.5-35B-A3B可將每月成本從2000歐元(購買Gemini服務)大幅降低至50歐元,顯著節省了開支。Qwen3.5-Flash作為托管生產版本,主打快速響應和強大性能,每百萬Token價格低至0.2元,支持1M超長上下文長度,滿足了長文檔和復雜任務處理的需求。

具體來看,Qwen3.5-122B-A10B是一個綜合能力突出的模型,適合多模態、視頻和多語言場景。在知識維度上,它在專業領域知識與推理、多語言與多領域知識以及研究生級知識與推理三項測評中均取得最高分。Qwen3.5-35B-A3B則專注于智能體深度能力,適用于智能體規劃、深度推理和任務調度,尤其在空間智能方面表現出色。Qwen3.5-27B(Dense)主打輕量化部署,工程實用度高,在交互、編程、長文本和數學方面表現優異。

在編程能力方面,Qwen3.5-27B在SWE-bench Verified測評中取得最高分,展示了其在真實軟件工程問題解決上的強大能力。而在通用智能體維度上,Qwen3.5系列在多項測評中取得領先成績,特別是在智能體任務執行與適配能力以及智能體深度規劃與邏輯推演能力方面表現突出。

多語言能力是Qwen3.5-122B-A10B的另一大亮點。在多模態能力方面,該模型在通用VQA領域表現強勢,拿下了多項最高分。Qwen3.5-27B則在多模態幻覺抑制與事實一致性能力以及學術文檔的理解與檢索能力等評測中表現最佳。在空間智能和視頻理解方面,Qwen3.5系列同樣實現了全維度領跑,特別是在帶字幕的視頻多模態理解能力和視頻與語言結合的跨模態理解能力方面表現尤為出色。

與上一代旗艦模型Qwen3相比,Qwen3.5在多個方面進行了增強。它采用了統一視覺語言基礎,實現了跨代對等,并在推理、編碼、Agent和視覺理解基準測試中優于Qwen3-VL模型。高效混合架構和可擴展的強化學習泛化技術使得Qwen3.5在保持高吞吐量推理的同時,最大限度地減少了延遲和成本開銷。Qwen3.5還擴展了全球語言覆蓋范圍,支持201種語言和方言,并具備細致入微的文化和區域理解能力。下一代訓練基礎設施的引入則進一步提高了多模態訓練效率,支持大規模代理支架和環境編排。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新