從僵硬到自然：人形機器人“照鏡子”看視頻解鎖逼真唇部動作新技能

發布時間：2026-01-20 04:06 來源：快訊作者：沈如風

哥倫比亞大學創意機器實驗室近日取得一項突破性進展：一款人形機器人通過自主視覺學習，實現了說話和唱歌時自然流暢的唇部動作。這項研究首次攻克了機器人面部表情僵硬的技術瓶頸，為人機交互的情感化發展開辟了新路徑。

傳統人形機器人雖在行走、抓取等肢體動作上取得顯著進步，但面部表情尤其是唇部運動始終存在"木偶感"。研究團隊指出，人類對微表情異常敏感，哪怕是0.1秒的延遲或肌肉運動偏差都會觸發"恐怖谷效應"，導致交互體驗大打折扣。這項成果通過創新學習機制，使機器人唇部動作的逼真度達到前所未有的水平。

該機器人面部采用26個微型馬達驅動柔性合成皮膚，可精準復現人類說話時的肌肉微運動。研發團隊設計了兩階段學習方案：首先讓機器人通過鏡面觀察完成數千次隨機表情生成，建立馬達運動與面部形態的映射關系；隨后利用YouTube視頻素材訓練視覺-動作轉換模型，使系統能直接將音頻信號轉化為馬達控制指令。這種無預設規則的學習方式，使機器人突破了傳統編程對元音/輔音的固定模式限制。

測試數據顯示，機器人已能同步多種語言的唇部運動，甚至可演唱AI原創歌曲《Hello World》中的曲目。盡管在爆破音"B"和噘唇音"W"等復雜發音上仍需優化，但其整體表現已遠超現有技術水平。實驗室主任霍德·利普森教授表示："隨著交互頻次增加，機器人的表情生成能力將持續進化，這種自我優化機制是本次研究的重大突破。"

這項技術不僅為娛樂產業帶來革新可能，更將深刻影響教育、醫療等需要情感交互的領域。研究負責人胡宇航指出，當逼真的面部動作與ChatGPT等對話系統結合時，可顯著增強用戶的情感共鳴體驗。隨著學習模型不斷積累對話語境數據，機器人將具備更精準的情境感知能力，例如通過微表情判斷用戶情緒狀態。

利普森教授特別強調面部表情在機器人產業化中的關鍵作用。當前全球人形機器人量產加速，經濟學家預測十年內產量將突破數十億臺，而公眾接受度很大程度上取決于機器人的"情感表現力"。他解釋道："現有研究多聚焦肢體機械性能，但應用于養老、教育場景的機器人必須具備與人類同等的情感表達能力。"

不過，研發團隊也清醒認識到技術帶來的倫理挑戰。隨著機器人面部表情日益逼真，人機情感邊界可能變得模糊。利普森呼吁建立審慎的技術發展框架："我們需要在追求技術突破的同時，構建相應的風險評估體系，避免因過度擬人化引發社會心理問題。"這項研究成果已發表于《科學·機器人學》期刊，為機器人情感表達研究樹立了新的里程碑。

更多>同類內容