在AI編程能力的全球競技場上,中國科技企業再次交出一份亮眼成績單。阿里巴巴最新發布的大語言模型Qwen 3.6-Plus,在權威盲測平臺LMArena旗下Code Arena榜單中斬獲React專項第二名,成為首個在該領域超越國際頂尖模型的中國大模型。這一突破性成果不僅刷新了國產模型的技術高度,更標志著中國AI在工程化應用層面實現重要跨越。
作為AI領域最具公信力的盲測平臺之一,LMArena通過真實用戶匿名評測、實時動態排名的機制,構建起全球大模型性能的"試金石"。其Code Arena榜單聚焦AI編程能力,在Agent技術浪潮下愈發受到行業關注。本次評測的React專項被視為當前AI代碼生成領域的技術制高點,要求模型在無人干預的條件下,獨立完成從項目初始化到調試運行的全流程開發,對工程思維和端到端能力提出嚴苛考驗。
數據顯示,Qwen 3.6-Plus以1452分的成績緊追Anthropic的Claude-Opus-4.6-Thinking(1540分),領先OpenAI最新發布的GPT-5.0-High達4分,較Google的Gemini 3.1 Pro Preview更是高出12分。這種以更小參數量實現更優性能的表現,在權威編程評測中已成常態——千問3.6系列此前已在多項測試中超越參數量數倍于己的GLM-5、Kimi-K2.5等模型,確立了國產模型在代碼生成領域的標桿地位。
該模型于4月2日正式發布后,立即在全球開發者社區引發強烈反響。其原生支持的多模態理解與推理能力,配合在代碼生成和Agent任務中的突出表現,使阿里在全球AI實驗室排名中躍升至第四位,形成與Anthropic、OpenAI、Google三強鼎立的競爭格局。特別值得關注的是,Qwen 3.6-Plus在全面評估AI編程能力的Code Arena總榜中,同樣位居國產模型首位。
據研發團隊透露,此次發布的Qwen 3.6-Plus僅是千問3.6系列的首款模型。按照規劃,后續將陸續開源不同參數規模的版本,并計劃于近期推出性能更強的旗艦模型Qwen 3.6-Max。這種"基礎模型+開源生態+旗艦產品"的立體化布局,預示著中國AI企業正在構建覆蓋全場景的技術矩陣,為全球開發者提供更具競爭力的解決方案。






















