在AI編程能力競技的全球舞臺上,中國科技企業再次交出亮眼答卷。阿里巴巴最新發布的大語言模型Qwen 3.6-Plus以1452分的成績,在Code Arena公布的React專項榜單中位列全球第二,成為首個在該領域躋身三甲的中國大模型。這一突破不僅刷新了國產模型的技術高度,更標志著中國在AI工程化應用領域實現重要跨越。
作為AI領域最具公信力的第三方評測平臺,LMArena旗下的Code Arena榜單采用"雙盲測試+實時對抗"機制,通過真實用戶提交的復雜Web開發任務,全面評估模型在項目初始化、代碼編寫、調試運行等全流程的自主能力。本次React專項測試聚焦AI Coding領域最前沿的技術方向,要求模型具備完整的工程思維和端到端開發能力,其難度遠超傳統代碼補全測試。
技術數據顯示,Qwen 3.6-Plus在多項核心指標上實現突破。該模型以4分優勢領先OpenAI最新發布的GPT-5.0-High(1448分),與Anthropic旗下的Claude-Opus-4.6-Thinking(1540分)的差距縮小至88分,同時以12分的優勢超越Google的Gemini 3.1 Pro Preview(1440分)。在代碼生成質量、工程化實現能力等關鍵維度,中國模型展現出與全球頂尖水平同臺競技的實力。
這款于4月2日正式發布的新一代模型,融合了原生多模態理解與強化推理能力,在代碼生成和Agent智能體技術方面形成獨特優勢。評測顯示,Qwen 3.6-Plus在參數規模僅為GLM-5、Kimi-K2.5等競品三分之一的情況下,憑借更高效的架構設計實現了性能反超。其代碼生成模塊能夠自動識別開發場景中的隱性需求,在復雜業務邏輯實現方面表現出色。
全球開發者社區對這一突破反應熱烈。模型發布首日即引發技術論壇熱議,次日便在React榜單實現登榜。在涵蓋多種編程范式的Code Arena綜合榜單中,Qwen 3.6-Plus同樣位居國產模型首位,助力阿里巴巴在全球AI實驗室排名中升至第四,形成與Anthropic、OpenAI、Google三強并立的競爭格局。
據研發團隊透露,Qwen 3.6-Plus作為千問3.6系列的首發模型,后續將開源不同參數規模的版本以滿足多樣化需求。性能更強的旗艦模型Qwen3.6-Max已完成訓練驗證,預計將于近期正式發布,有望在AI工程化領域掀起新的技術浪潮。






















