具身智能落地遇挑戰？智元SOP系統助力機器人“實戰練兵”持續進化

發布時間：2026-01-08 14:44 來源：快訊作者：蘇婉清

在具身智能領域，人形機器人正從實驗室走向真實場景，但落地難題始終橫亙在前。盡管各類展會上機器人已能完成禮賓引導、快遞分揀等任務，但面對真實世界的意外狀況時，其表現仍停留在“預設程序表演”階段，缺乏隨機應變能力。智元機器人合伙人、首席科學家羅劍嵐直言：“現實世界不是演示場景，機器人能否落地取決于可靠性，而非單純的功能展示。”

針對這一痛點，智元機器人推出面向真實世界部署的在線后訓練系統SOP，試圖重構機器人學習范式。傳統具身智能依賴視覺-語言-動作模型（VLA），通過圖片、視頻等離線數據訓練機器人“基本功”，但這種“閉門修煉”模式難以應對復雜環境。羅劍嵐比喻：“這就像照著秘籍在山洞練功，下山后才發現對手招式千變萬化，秘籍里的套路根本不夠用。”

SOP系統的核心在于構建“集體在線學習”閉環。數十臺具備基礎能力的機器人被派往真實場景“歷練”，無論任務成功或失敗，經驗都會實時回傳至云端算法模型。算法分析后更新訓練策略，再同步至所有機器人。這種“干中學”模式使機器人群體能快速積累真實場景經驗，避免傳統離線訓練中“復盤-修改-再訓練”的低效循環。實驗數據顯示，經過3小時在線訓練，機器人性能提升約30%；而引入80小時人類標注數據僅提升4%。“失敗經驗的價值遠高于預設數據，”羅劍嵐強調，“一個機器人犯錯，所有機器人都能學會規避。”

在商超整理、疊衣服等測試場景中，SOP系統的優勢已初步顯現。引入該系統后，機器人在物品繁雜的商超環境中綜合性能提升33%，疊衣服任務的操作吞吐量提高114%。更關鍵的是，經36小時連續運行測試，機器人展現出卓越的穩定性，能應對“物品突然掉落”“障礙物突然出現”等意外狀況。羅劍嵐認為，這種適應力源于真實場景中“踩坑”帶來的經驗積累：“機器人需要學會處理突發狀況，而不是僅執行預設程序。”

目前，智元已在真實場景中部署數十臺機器人用于SOP系統開發，并計劃今年將部署規模擴大數個量級。羅劍嵐透露，工業場景將是SOP系統的首要落地領域，目標是將任務成功率提升至可規模化應用的水平；家庭場景則需結合預訓練模型，逐步擴展任務能力。他預測，2026年將成為機器人從“能做事”到“把事做好”的關鍵節點：“未來，真實場景中部署的機器人數量將決定數據質量，進而影響模型迭代速度，形成正向循環。”

在應用探索方面，智元已邁出實質性步伐。幾天前，其靈犀X2機器人通過租賃平臺“擎天租”入駐上海漕河涇的美宜佳便利店，成為長期“員工”，負責商品整理、貨架補貨等任務。商超、文娛等場景的布局也在推進中。羅劍嵐表示，機器人產業可能從“一次性硬件交付”轉向“軟硬件持續服務”模式，類似自動駕駛系統的軟件更新機制：“機器人進廠或進家庭后，仍需通過真實場景數據持續優化，這將是提升用戶體驗的關鍵。”不過，他也坦言，這一過程需解決安全、隱私等倫理問題。

更多>同類內容