巨人財經 - 專業科技行業財經媒體

阿里HappyHorse 1.0開啟灰度測試,實測文生圖生視頻能力有亮點也有不足

   發布時間:2026-04-27 22:49 作者:趙云飛

阿里ATH創新事業部近日宣布,其最新研發的視頻生成與編輯模型HappyHorse 1.0(中文名:快樂小馬)正式啟動灰度測試。創作者可通過阿里云百煉平臺和HappyHorse官網注冊使用,普通用戶則能在千問App中體驗這一新工具。

在盲測平臺Arena.ai的評測中,HappyHorse 1.0在文生視頻、圖生視頻和視頻編輯三個榜單中均位列第二,緊隨近期備受關注的字節Seedance 2.0之后。為了解其實際表現,記者進行了多維度測試。

HappyHorse 1.0的操作十分簡便,用戶只需輸入文字描述,即可生成3至15秒的視頻,視頻中可實現多鏡頭切換和連貫劇情。官網信息顯示,該模型最高支持1080p分辨率,最多可同時生成4個視頻。價格方面,生成720p和1080p視頻的刊例價分別為每秒0.9元和1.6元,Pro套餐包月價格疊加限時折扣后為每秒0.44元和0.78元。

目前,HappyHorse 1.0已集成到阿里旗下多款產品中,包括阿里悟空、MuleRun和JVS Claw等Agent平臺。千問App預告,近期將推出“測一測”視頻玩法,用戶可測出自己在短劇宇宙中的本名角色,并通過HappyHorse 1.0生成本人“出演”的角色短劇片段。

在測試過程中,HappyHorse 1.0展現了指令遵循和生成速度方面的優勢,但也暴露出畫面物理準確性、音畫同步等方面的不足。具體而言,其生成速度較快,一段視頻約需2至5分鐘;指令遵循能力強,能準確理解并執行復雜的提示詞要求;圖生視頻中,多元素參考還原度較高。然而,音畫同步仍有提升空間,尤其在樂器演奏等復雜場景中,手部動作與音頻節奏存在錯位;長敘事視頻中易出現物理bug,如無外力物體自移動;畫面中文字渲染常出現亂碼或錯誤。

在文生視頻能力測試中,HappyHorse 1.0的表現可圈可點。例如,在生成街頭音樂表演視頻時,模型雖能準確呈現人像、鏡頭運動和畫面燈光等元素,但吉他手演奏與音樂節奏不同步,尤其在快速掃弦和重拍落點上,手部動作與音頻音符錯位,影響了真實感。在模擬海邊懸崖場景時,模型成功還原了波濤洶涌的效果,海浪與巖石的撞擊、海面泡沫均符合物理規律,但近景畫面中水滴滑落速度偏慢,略顯不自然。在處理長達800詞的復雜提示詞時,模型雖能準確呈現畫面元素,但開頭出現車門無故關閉的物理bug,最后一個鏡頭中主角變化也顯示出一致性方面的不足。

在圖生視頻測試中,HappyHorse 1.0支持最多9張圖片參考。測試中,模型成功生成了OpenAI聯合創始人薩姆·奧爾特曼喝咖啡的畫面,人物與真人照片相似度達八成,且樣貌未隨光線和背景變化而改變。在生成馬斯克與奧爾特曼“對簿公堂”畫面時,模型雖能呈現二人爭論場景,但人物表情與參考圖偏差明顯,且初期版本中“馬斯克”說中文,細化要求后才改為英語。在生成離職畫面時,模型準確呈現了上傳的所有參考元素,但出現紙箱自動合上、門自動打開等物理bug。

多位參與測試的業內人士對HappyHorse 1.0的表現進行了評價。出海一站式AI電商營銷平臺麥斯國際的技術合伙人李明認為,3至15秒的生成長度、較快的生成速度和支持1080p是該模型的亮點,但在生成結果一致性和語音內容機械感方面仍有提升空間。他指出,字幕渲染是當前AI視頻生成模型的通病,業內通常借助后期工具補充,音畫同步效果則可通過提示詞工程優化。AI視頻創作平臺FLOVA相關團隊認為,HappyHorse 1.0在真實感和敘事能力上表現不錯,尤其適合敘事性內容和紀錄片風格題材,其焦段運用接近實拍,鏡頭運動自然,減輕了視頻的“AI感”。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新