在智能制造領域,小米機器人團隊近日交出了一份令人矚目的答卷:其自主研發的人形機器人成功在汽車制造工廠完成3小時連續作業,實現了雙側自攻螺母安裝任務,成功率達90.2%,且完全滿足產線76秒的生產節拍要求。這一突破標志著人形機器人從實驗室走向真實工業場景邁出了關鍵一步,也為智能制造提供了新的解決方案。
此次作業的工站任務極具挑戰性:機器人需在汽車一體化壓鑄的后地板零件上,從自動送釘設備中精準抓取螺母,將其放置在定位工裝上,并配合后續工位完成自攻擰緊。整個過程要求雙臂協同,在76秒內完成雙側螺母的同時安裝。自攻螺母內側的花鍵結構、每次抓取不固定的手內姿態,以及定位銷軸上磁吸力帶來的拉扯影響,都大幅增加了裝配難度。傳統“規則編程”方式難以應對如此復雜的真實作業環境,小米團隊因此選擇了“自主學習”的技術路徑。
核心技術框架基于Xiaomi-Robotics-0通用VLA基座模型構建。該模型通過統一的動作空間設計和跨本體數據預訓練,賦予機器人對操作任務的理解和空間感知能力。為進一步提升適應性,團隊引入“VLA+RL(強化學習)”聯合訓練框架:VLA模型提供基礎“常識”,強化學習則讓機器人在真實物理環境中通過交互試錯,不斷迭代行為策略。這種模式顯著減少了對昂貴且低效的真實遙操作數據的依賴,使機器人能更快適配多樣化工況。
全身運動控制采用混合架構設計:基于二次規劃的優化控制器以亞毫秒級速度處理平衡、安全、任務等多級優先級控制;在仿真平臺中歷經數億次訓練的強化學習控制器,則負責應對極端干擾,學會在失穩時保持平衡,并能零樣本遷移至真實機器人。這種設計使機器人既能高效完成常規任務,又能靈活應對突發狀況。
為解決精細操作難題,團隊開發了純觸覺驅動的抓取微調模型TacRefineNet。該模型無需視覺輔助,僅憑指尖高精度觸覺陣列即可實現毫米級位姿調整,并直接部署于產線。這些技術突破共同構成了機器人進廠的技術底氣:Xiaomi-Robotics-0作為“大腦”負責理解與決策,TacRefineNet作為“小腦”優化動作精度,CyberOne人形機器人作為“身體”執行任務。
這一成果并非偶然。小米在機器人領域的布局可追溯至2021年發布的四足機器人CyberDog“鐵蛋”,以及2022年亮相的全尺寸人形機器人CyberOne“鐵大”。身高177cm、體重52kg的“鐵大”搭載了仿生感知認知技術與Mi-Sense視覺空間系統,能感知人類情緒并實現雙足平衡,其關節控制、動力輸出等底層技術為當前工業應用奠定了基礎。2026年2月開源的VLA大模型Xiaomi-Robotics-0則進一步賦予機器人“思考”能力:該模型擁有47億參數,采用“大腦+小腦”MoT混合架構,在主流仿真測試中刷新SOTA紀錄,并能在消費級顯卡上實現80ms低延遲推理。
目前,小米已將機器人業務整合至北京小米機器人技術有限公司,總部遷入亦莊小米汽車工廠,實現研發制造一體化。除自攻螺母安裝外,料箱搬運、前徽標安裝等其他典型工站的部署驗證工作也在推進中。這些工站將對機器人的移動操作、全身協同及靈巧手作業效率提出更高要求。雷軍透露,未來五年將有大批量人形機器人進入小米工廠作業,這類來自真實場景的實測數據,將為行業提供極具參考價值的演進軌跡。





















