在人工智能領域的前沿探索中,小米團隊近期取得多項突破性進展,其多篇研究成果成功入選國際頂級會議ICLR 2026。這一會議以推動人工智能理論與方法創新為核心目標,小米團隊的入選成果覆蓋多模態推理、強化學習、智能體交互、自動駕駛及音頻生成等關鍵方向,展現了該公司在AI技術全棧布局中的深厚積累。
針對強化學習領域長期存在的訓練效率瓶頸,小米團隊提出的《Shuffle-R1》框架通過動態重組數據流實現突破。該研究創新性引入成對軌跡采樣與優勢值批次重排序技術,有效解決了多模態大模型訓練中的優勢坍縮與軌跡沉默問題。實驗數據顯示,在保持極低計算開銷的同時,該框架在多個基準測試中超越現有強化學習基線模型,為復雜場景下的智能決策提供了新范式。
在移動智能體交互領域,《MobileIPL》研究構建了迭代偏好學習框架,通過Thinking-level DPO技術實現思考步驟的精細化優化。其獨創的三階段指令演化機制突破了高質量軌跡數據稀缺的制約,在AITZ等主流GUI-Agent測試中刷新性能紀錄。該成果特別在分布外場景中展現出顯著增強的魯棒性,為智能設備的人機交互提供了更可靠的解決方案。
端到端自動駕駛研究方面,《ReCogDrive》項目實現了多技術模塊的深度融合。研究團隊通過分層認知數據流水線注入駕駛領域知識,結合認知引導擴散規劃器生成物理可行軌跡,并首創DiffGRPO強化學習算法直接優化駕駛策略。閉環測試表明,該方案在NAVSIM與Bench2Drive等平臺上的表現全面領先現有技術路線,為自動駕駛系統的認知能力提升開辟了新路徑。
其他創新成果同樣引人注目:《ThinkOmni》研究實現了文本推理能力向視覺、語音等多模態的零成本遷移;《Flow2GAN》通過融合流匹配與對抗生成技術,在保持音頻高保真度的同時將合成步數大幅壓縮;《WorldSplat》則突破4D動態駕駛場景生成技術,為自動駕駛仿真測試提供更真實的虛擬環境。這些成果共同構成了小米在人工智能領域的技術矩陣,彰顯其從基礎研究到應用落地的全鏈條創新能力。






















