全球AI編程大模型盲測新榜揭曉，阿里Qwen3.6-Plus躋身全球第二中國第一

發布時間：2026-04-04 14:38 來源：快訊作者：楊凌霄

在AI編程能力的全球競技場上，中國科技企業再次交出一份亮眼成績單。阿里巴巴最新發布的大語言模型Qwen 3.6-Plus，在權威盲測平臺LMArena旗下Code Arena榜單中斬獲React專項第二名，成為首個在該領域超越國際頂尖模型的中國大模型。這一突破性成果不僅刷新了國產模型的技術高度，更標志著中國AI在工程化應用層面實現重要跨越。

作為AI領域最具公信力的盲測平臺之一，LMArena通過真實用戶匿名評測、實時動態排名的機制，構建起全球大模型性能的"試金石"。其Code Arena榜單聚焦AI編程能力，在Agent技術浪潮下愈發受到行業關注。本次評測的React專項被視為當前AI代碼生成領域的技術制高點，要求模型在無人干預的條件下，獨立完成從項目初始化到調試運行的全流程開發，對工程思維和端到端能力提出嚴苛考驗。

數據顯示，Qwen 3.6-Plus以1452分的成績緊追Anthropic的Claude-Opus-4.6-Thinking（1540分），領先OpenAI最新發布的GPT-5.0-High達4分，較Google的Gemini 3.1 Pro Preview更是高出12分。這種以更小參數量實現更優性能的表現，在權威編程評測中已成常態——千問3.6系列此前已在多項測試中超越參數量數倍于己的GLM-5、Kimi-K2.5等模型，確立了國產模型在代碼生成領域的標桿地位。

該模型于4月2日正式發布后，立即在全球開發者社區引發強烈反響。其原生支持的多模態理解與推理能力，配合在代碼生成和Agent任務中的突出表現，使阿里在全球AI實驗室排名中躍升至第四位，形成與Anthropic、OpenAI、Google三強鼎立的競爭格局。特別值得關注的是，Qwen 3.6-Plus在全面評估AI編程能力的Code Arena總榜中，同樣位居國產模型首位。

據研發團隊透露，此次發布的Qwen 3.6-Plus僅是千問3.6系列的首款模型。按照規劃，后續將陸續開源不同參數規模的版本，并計劃于近期推出性能更強的旗艦模型Qwen 3.6-Max。這種"基礎模型+開源生態+旗艦產品"的立體化布局，預示著中國AI企業正在構建覆蓋全場景的技術矩陣，為全球開發者提供更具競爭力的解決方案。

更多>同類內容