阿里發布Qwen3-Max-Thinking模型，性能比肩國際頂尖，推理能力創新高

發布時間：2026-01-27 12:01 來源：快訊作者：周琳

阿里正式推出其最新旗艦推理模型——千問Qwen3-Max-Thinking，該模型在多項權威評測中刷新全球紀錄，成為國內最接近國際頂尖水平的AI大模型，性能表現可與GPT-5.2和Gemini 3 Pro相媲美。

作為阿里規模最大、能力最強的千問推理模型，Qwen3-Max-Thinking擁有超過萬億參數，并基于36T Tokens的預訓練數據構建。通過極致擴展總參數、強化學習及推理計算規模，新模型在科學知識、數學推理和代碼編程等關鍵性能基準測試中取得突破性進展，刷新多項全球紀錄。

在推理能力提升方面，千問團隊創新性地引入測試時擴展（Test-time Scaling）機制。該機制突破傳統推理計算中簡單增加并行路徑的局限，通過“經驗提取”方式對過往推理結果進行提煉，實現多輪自我迭代。這一設計使模型在相同上下文中完成更高效的推理計算，顯著提升性能與效率。例如，在“人類最后的測試”（HLE）中，Qwen3-Max-Thinking以58.3分的成績超越GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分，創下當前所有模型的最高分。

面向智能體（Agent）時代需求，Qwen3-Max-Thinking進一步強化了自主調用工具的原生Agent能力。通義團隊在完成初步工具使用微調后，通過規則獎勵與模型獎勵聯合強化學習訓練，使模型具備智能結合工具進行思考的能力。在QwenChat平臺上，用戶可體驗模型自主調用搜索、個性化記憶和代碼解釋器等核心Agent工具，獲得專業級回答。這種自適應工具調用機制不僅提升了回答的智能性與流暢度，還大幅降低模型幻覺，為解決復雜任務提供可靠支持。

目前，開發者可通過QwenChat平臺免費體驗Qwen3-Max-Thinking模型，企業用戶可通過阿里云百煉獲取API服務，普通用戶則可通過千問PC端和網頁端直接試用。千問App即將完成新模型接入，屆時所有用戶均可免費體驗這一國內最強AI大模型的強大能力。

更多>同類內容