巨人財經 - 專業科技行業財經媒體

馬斯克點贊,Kimi重構AI底層架構,中國團隊引領技術新突破

   發布時間:2026-03-19 03:08 作者:胡穎

中國AI企業月之暗面旗下的Kimi再次成為全球科技界焦點。其發布的《Attention Residuals》技術報告提出對深度學習核心架構的創新性改造,在Twitter引發持續三天的熱議,主貼閱讀量突破460萬次。這項突破性成果不僅獲得OpenAI前研究副總裁Jerry Tworek"深度學習2.0"的高度評價,更贏得馬斯克"令人印象深刻"的公開稱贊,雙方在社交平臺的互動折射出中外AI技術的深度共鳴。

傳統殘差連接結構自2015年ResNet論文問世以來,始終是支撐大模型訓練的基石技術。該機制通過將每層輸出與輸入相加的方式,確保信息在深層網絡中有效傳遞。但隨著模型規模擴張,這種"無差別累加"的缺陷日益凸顯:重要信息被稀釋、計算效率降低、訓練穩定性下降。Kimi團隊提出的注意力殘差方案,創造性地引入動態注意力機制,使模型能夠自主篩選關鍵信息,實現1.25倍的訓練效率提升。

在英偉達GTC 2026大會上,創始人楊植麟以《How We Scaled Kimi K2.5》為題,系統闡釋了技術突破背后的戰略思考。他指出當前行業普遍使用的優化器、注意力機制等底層技術,本質上是八九年前的產物,已逐漸成為智能升級的瓶頸。Kimi通過重構三大基石技術構建完整創新閉環:MuonClip優化器將計算效率提升至傳統方法的2倍;Kimi Linear混合架構使長文本解碼速度提升5-6倍;注意力殘差方案則突破信息傳遞的固有局限。

技術突破帶來的商業價值正在顯現。作為全球用戶量最大的AI編程平臺Cursor和獨立搜索服務商Perplexity唯一接入的中國開源模型,K2.5憑借90%性能、七分之一價格的競爭優勢,在海外實現20天收入超2025全年。其API平臺日均訪問量激增10-20倍,海外收入占比反超國內市場。資本市場的追捧更具說服力,近三個月估值暴漲4倍,融資規模超過多數同行IPO募資額。

楊植麟在演講中特別強調,Kimi的野心不止于打造更優秀的模型,而是要定義下一代架構標準。他提出的智能體集群進化預判,已通過Orchestrator機制實現初步驗證——該系統可將復雜任務拆解為數十個子任務并行處理,形成自協調的群體智能。這種從底層技術到應用場景的完整創新體系,標志著中國AI企業正式躋身全球技術規則制定者行列。

支撐這場技術革命的,是研究范式的根本轉變。楊植麟指出,十年前受限于算力資源,研究者難以通過規模化實驗驗證設想。如今"縮放階梯"的成熟,使得嚴謹的規模化驗證成為可能。Kimi團隊正是通過這種系統性實驗方法,在優化器、注意力機制等傳統領域挖掘出突破性創新,為全球AI發展開辟了新的技術路徑。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新