2024年末,硅谷與北京的科技圈被同一個話題震動:大模型領域的Scaling Law似乎遭遇瓶頸。彼時,英偉達股價仍在攀升,但多方消息顯示,包括備受期待的Orion(原計劃中的GPT-5)在內的新一代模型,單純通過增加參數和訓練數據已難以實現預期的性能躍升。更有研究預測,預訓練所需的數據資源將在2028年耗盡,這一論斷為行業蒙上一層陰影。
轉折發生在2025年初。OpenAI率先推出o1模型,通過引入強化推理機制,證明“測試時間擴展”(test-time scaling)可顯著提升模型智能水平——即通過延長思考時間換取更深度的推理能力。然而,o1的閉源特性使其技術門檻高不可攀,行業一度認為這是巨頭專屬的“黑科技”。直到同年1月,DeepSeek R1橫空出世,不僅復現了o1的技術路線,更以開源姿態向全行業開放,徹底打破了僵局。其核心突破在于:通過強化學習驅動的思維鏈(CoT),使模型具備類似人類“慢思考”的推理能力,證明參數規模并非唯一關鍵,深度推理能力才是突破瓶頸的核心。
這一變革迅速重塑行業格局。九章云極DataCanvas AI首席科學家繆旭在2025算力生態大會上指出:“DeepSeek的出現讓我們意識到,強化學習能重新激活大模型的進化速度。”更關鍵的是,它降低了技術門檻,讓算力重心從“預訓練擴展”轉向“后訓練擴展”與“測試時間擴展”。英偉達博客的一篇分析也印證了這一趨勢:當模型能力不再僅依賴海量數據,算力消耗的重心正從靜態訓練轉向動態探索與推理,傳統云計算架構已難以支撐。
面對新范式,行業亟需全新的算力基礎設施。繆旭在演講中提出一個關鍵公式:“當智能可以并行進化,強化學習云將成為群體智能的放大器。”這一概念由九章云極率先定義,并成為其應對變革的核心戰略。作為獨立智算云賽道的領軍企業,九章云極不僅提出理念,更通過前瞻性布局,成為后訓練時代算力標準的制定者。
其優勢源于對趨勢的精準把握。2025年6月,九章云極發布全球首個工業級強化學習云平臺Agentic RL,而此時主流市場仍聚焦于擴大預訓練集群或降低傳統推理成本。Agentic RL的獨特性在于:它未在舊架構上修補,而是基于混合專家(MoE)架構與Serverless理念,實現算力的“按需即取、即用即還”。數據顯示,該平臺將端到端訓練效率提升500%,綜合成本下降60%,并成為全球首個支持萬卡級異構算力調度的強化學習基礎設施。這一突破標志著九章云極從“賣資源”升級為“賣能力”,重新定義了算力服務模式。
Agentic RL的核心目標是讓通用模型進化為專家模型。繆旭解釋,其技術架構賦予模型長時程規劃、復雜工具調用、檢索增強生成優化等能力,使模型從“語言專家”升級為能解決實際物理問題的“執行者”。更宏大的構想是:未來的通用人工智能(AGI)可能由成千上萬個垂類專家智能體組成“群體智能”,而非單一巨型模型。為支撐這一目標,九章云極開發了多項核心技術,例如全異步訓練架構將GPU利用率穩定在95%以上,基于回放的離線強化學習算法使訓練速度提升5倍,以及與高校合作構建的“世界模型”,為自動駕駛等高風險領域提供安全探索的虛擬沙盒。
支撐這一技術體系的,是九章云極精心打造的Alaya NeW Cloud智能基礎設施。與傳統云廠商在通用云上“打補丁”不同,Alaya NeW Cloud從底層到應用完成四層全棧重構,圍繞智能體運行邏輯優化設計。例如,其云容器實例(CCI)支持一鍵部署,可快速適配最新模型——2025年末上線的滿血版DeepSeek-3.2即通過該平臺實現高效運行,驗證了其對前沿技術的快速支持能力。
技術領先僅是起點,真實場景落地才是檢驗標準。在安徽黃山,九章云極創造了行業紀錄:僅用48天便建成一座500 PFLOPS規模的“大位”智算中心,并投入運營。這一速度不僅體現其工程化能力,更證明其智算操作系統在異構算力調度上的高效性。“大位”中心并非傳統機房,而是國內首個“文旅+AI”城市級產業應用基礎設施。依托強化學習技術,黃山實現全國首個“全程AI伴游”景區:數千個智能體在此學習理解游客意圖、規劃路線、處理突發狀況,通過真實互動不斷優化策略。這種在高頻場景中的智能進化能力,遠比實驗室數據更具商業價值。
智算中心的經濟效益同樣顯著。根據《2026智算賦能城市產業發展白皮書》,黃山模式被定義為“中小城市智算賦能標桿”。易觀分析預測,“大位”中心全面達產后,每年將直接帶動黃山市營利性服務業增加值增長超2億元。九章云極董事長方磊在大會上強調:“算力的核心價值在于普惠與落地效能。”黃山實踐證明,強化學習云不僅能消耗電力,更能生產GDP。這一成果吸引中科動力、百鵬互聯等6家AI企業集中簽約,形成“算力底座+豐富場景”的智算生態。
在AI基礎設施領域,九章云極選擇了一條獨特道路:做獨立智算云賽道的領軍者。其“獨立性”體現在明確邊界——不與客戶爭利,不綁定特定模型,而是倡導“開源1000專家模型”,通過動態組合放大群體智能,為中小企業提供高效解決方案。這種模式與綁定閉源大模型的巨頭云廠商形成鮮明對比,更易構建開放生態。例如,其發起的AI-STAR企業生態聯盟連接上下游廠商,形成自主可控的產業鏈閉環。
領軍者的地位不僅體現在規模,更在于定義規則的能力。在算力計費混亂的時代,九章云極率先推出“1度算力”普惠標準;在后訓練時代,其通過Agentic RL定義了下一代基礎設施的標準架構,包括Serverless彈性調度和異構資源管理。這些舉措使其從“賣算力”升級為“定標準”,成為行業規則的制定者。
2026年的云計算競爭已進入“進化時代”,焦點從“降低電費”轉向“加速智能體進化”。作為獨立智算云賽道的領軍企業,九章云極通過Agentic RL平臺,為全球硅基智能體提供了進化引擎。在黃山的數據中心里,成千上萬個智能體正日夜不息地自我博弈——這場關于“進化”的故事,才剛剛開始。






















