巨人財經 - 專業科技行業財經媒體

阿里HappyHorse 1.0上線實測:馬斯克奧爾特曼“對簿公堂”,生成能力有亮點也有不足

   發布時間:2026-04-27 21:51 作者:吳婷

阿里ATH創新事業部近日宣布,其最新研發的視頻生成與編輯模型HappyHorse 1.0(中文名:快樂小馬)正式啟動灰度測試。創作者可通過阿里云百煉平臺及HappyHorse官網注冊體驗,普通用戶則能在千問App中率先感受這一創新成果。

在盲測平臺Arena.ai的激烈競爭中,HappyHorse 1.0憑借其卓越性能,在文生視頻、圖生視頻及視頻編輯三大榜單上均斬獲第二名,緊隨近期備受矚目的字節Seedance 2.0之后。為深入探究其實際表現,我們進行了全面而細致的測試。

HappyHorse 1.0的操作簡便直觀,用戶只需輸入簡短的文字描述,即可生成時長在3秒至15秒之間的視頻。這些視頻不僅包含多鏡頭切換,還能展現連貫的劇情發展。更令人驚喜的是,該模型最高支持1080p分辨率,且能同時生成多達4個視頻。在價格方面,生成720P和1080P視頻的刊例價分別為每秒0.9元和1.6元,而Pro套餐在疊加限時折扣后,價格更是低至每秒0.44元和0.78元。

在測試過程中,HappyHorse 1.0展現出了諸多亮點。其生成速度之快令人印象深刻,一段視頻的生成時間僅需約2至5分鐘,與其他同類模型相比具有明顯優勢。同時,該模型對指令的遵循能力也十分出色,能夠準確理解并執行復雜的提示詞要求,包括鏡頭運動、畫面構圖以及風格氛圍等。在圖生視頻方面,HappyHorse 1.0同樣表現出色,能夠準確呈現所有上傳的參考元素,如人物、場景和道具等。

然而,測試也揭示了HappyHorse 1.0在某些方面仍有待提升。例如,在音畫同步方面,雖然人聲和音效的同步效果較好,但在樂器演奏等復雜場景中,模型生成的手部動作與音頻節奏之間存在明顯的錯位。在生成較長視頻時,模型偶爾會出現物理bug,如無外力作用下的物體自移動等。同時,畫面中的文字渲染也存在問題,經常出現亂碼或錯誤。

在文生視頻的測試中,我們特別關注了模型的指令遵循能力、生成結果的物理準確性以及音畫同步效果。以一個街頭音樂表演的場景為例,HappyHorse 1.0成功生成了符合提示詞要求的視頻,包括鼓手敲擊節奏、吉他手彈奏旋律以及觀眾隨節奏拍手等。然而,在吉他手的演奏部分,畫面中的手部動作與音頻中的音符出現了錯位,影響了演奏的真實感和沉浸感。

另一個測試案例則聚焦于物理真實性的模擬。在這個場景中,HappyHorse 1.0需要呈現海邊懸崖上波濤洶涌的效果。最終,模型成功還原了海浪與巖石的撞擊以及海面上的泡沫等細節,但在水滴滑落速度方面略顯不足,與物理規律存在細微偏差。

除了文生視頻外,我們還對HappyHorse 1.0的圖生視頻和視頻編輯能力進行了測試。在圖生視頻方面,我們嘗試了首幀模式和多人物參考等場景。雖然模型在某些情況下拒絕了生成請求,但在成功生成的案例中,它展現出了較高的參考元素還原度和人物相似度。然而,在多人物參考場景中,模型對人物語言的理解存在偏差,且生成結果的一致性有待提高。

在視頻編輯能力的測試中,我們未能成功體驗相關功能。但據阿里方面介紹,HappyHorse 1.0也支持視頻編輯功能,未來有望為用戶提供更多元化的視頻創作體驗。

多位參與HappyHorse 1.0測試的業內人士對其表現給予了評價。他們認為,該模型在生成長度、生成速度以及分辨率支持等方面具有明顯優勢,但在生成結果的一致性和語音內容的機械感等方面仍有提升空間。同時,他們也指出了當前AI視頻生成模型在文字渲染和音畫同步方面存在的普遍問題,并認為這些問題需要通過技術迭代和優化來解決。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新