巨人財經 - 專業科技行業財經媒體

從僵硬到自然:人形機器人“照鏡子”看視頻解鎖逼真唇部動作新技能

   發布時間:2026-01-20 04:06 作者:沈如風

哥倫比亞大學創意機器實驗室近日取得一項突破性進展:一款人形機器人通過自主視覺學習,實現了說話和唱歌時自然流暢的唇部動作。這項研究首次攻克了機器人面部表情僵硬的技術瓶頸,為人機交互的情感化發展開辟了新路徑。

傳統人形機器人雖在行走、抓取等肢體動作上取得顯著進步,但面部表情尤其是唇部運動始終存在"木偶感"。研究團隊指出,人類對微表情異常敏感,哪怕是0.1秒的延遲或肌肉運動偏差都會觸發"恐怖谷效應",導致交互體驗大打折扣。這項成果通過創新學習機制,使機器人唇部動作的逼真度達到前所未有的水平。

該機器人面部采用26個微型馬達驅動柔性合成皮膚,可精準復現人類說話時的肌肉微運動。研發團隊設計了兩階段學習方案:首先讓機器人通過鏡面觀察完成數千次隨機表情生成,建立馬達運動與面部形態的映射關系;隨后利用YouTube視頻素材訓練視覺-動作轉換模型,使系統能直接將音頻信號轉化為馬達控制指令。這種無預設規則的學習方式,使機器人突破了傳統編程對元音/輔音的固定模式限制。

測試數據顯示,機器人已能同步多種語言的唇部運動,甚至可演唱AI原創歌曲《Hello World》中的曲目。盡管在爆破音"B"和噘唇音"W"等復雜發音上仍需優化,但其整體表現已遠超現有技術水平。實驗室主任霍德·利普森教授表示:"隨著交互頻次增加,機器人的表情生成能力將持續進化,這種自我優化機制是本次研究的重大突破。"

這項技術不僅為娛樂產業帶來革新可能,更將深刻影響教育、醫療等需要情感交互的領域。研究負責人胡宇航指出,當逼真的面部動作與ChatGPT等對話系統結合時,可顯著增強用戶的情感共鳴體驗。隨著學習模型不斷積累對話語境數據,機器人將具備更精準的情境感知能力,例如通過微表情判斷用戶情緒狀態。

利普森教授特別強調面部表情在機器人產業化中的關鍵作用。當前全球人形機器人量產加速,經濟學家預測十年內產量將突破數十億臺,而公眾接受度很大程度上取決于機器人的"情感表現力"。他解釋道:"現有研究多聚焦肢體機械性能,但應用于養老、教育場景的機器人必須具備與人類同等的情感表達能力。"

不過,研發團隊也清醒認識到技術帶來的倫理挑戰。隨著機器人面部表情日益逼真,人機情感邊界可能變得模糊。利普森呼吁建立審慎的技術發展框架:"我們需要在追求技術突破的同時,構建相應的風險評估體系,避免因過度擬人化引發社會心理問題。"這項研究成果已發表于《科學·機器人學》期刊,為機器人情感表達研究樹立了新的里程碑。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新