在具身智能領域,人形機器人正從實驗室走向真實場景,但落地難題始終橫亙在前。盡管各類展會上機器人已能完成禮賓引導、快遞分揀等任務,但面對真實世界的意外狀況時,其表現仍停留在“預設程序表演”階段,缺乏隨機應變能力。智元機器人合伙人、首席科學家羅劍嵐直言:“現實世界不是演示場景,機器人能否落地取決于可靠性,而非單純的功能展示。”
針對這一痛點,智元機器人推出面向真實世界部署的在線后訓練系統SOP,試圖重構機器人學習范式。傳統具身智能依賴視覺-語言-動作模型(VLA),通過圖片、視頻等離線數據訓練機器人“基本功”,但這種“閉門修煉”模式難以應對復雜環境。羅劍嵐比喻:“這就像照著秘籍在山洞練功,下山后才發現對手招式千變萬化,秘籍里的套路根本不夠用。”
SOP系統的核心在于構建“集體在線學習”閉環。數十臺具備基礎能力的機器人被派往真實場景“歷練”,無論任務成功或失敗,經驗都會實時回傳至云端算法模型。算法分析后更新訓練策略,再同步至所有機器人。這種“干中學”模式使機器人群體能快速積累真實場景經驗,避免傳統離線訓練中“復盤-修改-再訓練”的低效循環。實驗數據顯示,經過3小時在線訓練,機器人性能提升約30%;而引入80小時人類標注數據僅提升4%。“失敗經驗的價值遠高于預設數據,”羅劍嵐強調,“一個機器人犯錯,所有機器人都能學會規避。”
在商超整理、疊衣服等測試場景中,SOP系統的優勢已初步顯現。引入該系統后,機器人在物品繁雜的商超環境中綜合性能提升33%,疊衣服任務的操作吞吐量提高114%。更關鍵的是,經36小時連續運行測試,機器人展現出卓越的穩定性,能應對“物品突然掉落”“障礙物突然出現”等意外狀況。羅劍嵐認為,這種適應力源于真實場景中“踩坑”帶來的經驗積累:“機器人需要學會處理突發狀況,而不是僅執行預設程序。”
目前,智元已在真實場景中部署數十臺機器人用于SOP系統開發,并計劃今年將部署規模擴大數個量級。羅劍嵐透露,工業場景將是SOP系統的首要落地領域,目標是將任務成功率提升至可規模化應用的水平;家庭場景則需結合預訓練模型,逐步擴展任務能力。他預測,2026年將成為機器人從“能做事”到“把事做好”的關鍵節點:“未來,真實場景中部署的機器人數量將決定數據質量,進而影響模型迭代速度,形成正向循環。”
在應用探索方面,智元已邁出實質性步伐。幾天前,其靈犀X2機器人通過租賃平臺“擎天租”入駐上海漕河涇的美宜佳便利店,成為長期“員工”,負責商品整理、貨架補貨等任務。商超、文娛等場景的布局也在推進中。羅劍嵐表示,機器人產業可能從“一次性硬件交付”轉向“軟硬件持續服務”模式,類似自動駕駛系統的軟件更新機制:“機器人進廠或進家庭后,仍需通過真實場景數據持續優化,這將是提升用戶體驗的關鍵。”不過,他也坦言,這一過程需解決安全、隱私等倫理問題。





















