雷軍宣布小米AI研究再突破多篇成果入選ICLR 2026 覆蓋多領域創新

發布時間：2026-02-04 03:02 來源：快訊作者：吳婷

在人工智能領域的前沿探索中，小米團隊近期取得多項突破性進展，其多篇研究成果成功入選國際頂級會議ICLR 2026。這一會議以推動人工智能理論與方法創新為核心目標，小米團隊的入選成果覆蓋多模態推理、強化學習、智能體交互、自動駕駛及音頻生成等關鍵方向，展現了該公司在AI技術全棧布局中的深厚積累。

針對強化學習領域長期存在的訓練效率瓶頸，小米團隊提出的《Shuffle-R1》框架通過動態重組數據流實現突破。該研究創新性引入成對軌跡采樣與優勢值批次重排序技術，有效解決了多模態大模型訓練中的優勢坍縮與軌跡沉默問題。實驗數據顯示，在保持極低計算開銷的同時，該框架在多個基準測試中超越現有強化學習基線模型，為復雜場景下的智能決策提供了新范式。

在移動智能體交互領域，《MobileIPL》研究構建了迭代偏好學習框架，通過Thinking-level DPO技術實現思考步驟的精細化優化。其獨創的三階段指令演化機制突破了高質量軌跡數據稀缺的制約，在AITZ等主流GUI-Agent測試中刷新性能紀錄。該成果特別在分布外場景中展現出顯著增強的魯棒性，為智能設備的人機交互提供了更可靠的解決方案。

端到端自動駕駛研究方面，《ReCogDrive》項目實現了多技術模塊的深度融合。研究團隊通過分層認知數據流水線注入駕駛領域知識，結合認知引導擴散規劃器生成物理可行軌跡，并首創DiffGRPO強化學習算法直接優化駕駛策略。閉環測試表明，該方案在NAVSIM與Bench2Drive等平臺上的表現全面領先現有技術路線，為自動駕駛系統的認知能力提升開辟了新路徑。

其他創新成果同樣引人注目：《ThinkOmni》研究實現了文本推理能力向視覺、語音等多模態的零成本遷移；《Flow2GAN》通過融合流匹配與對抗生成技術，在保持音頻高保真度的同時將合成步數大幅壓縮；《WorldSplat》則突破4D動態駕駛場景生成技術，為自動駕駛仿真測試提供更真實的虛擬環境。這些成果共同構成了小米在人工智能領域的技術矩陣，彰顯其從基礎研究到應用落地的全鏈條創新能力。

更多>同類內容