巨人財經 - 專業科技行業財經媒體

昆侖萬維SkyReels V4發布:技術突圍下中國視頻大模型的新征程與挑戰

   發布時間:2026-02-28 21:04 作者:吳俊

中國視頻生成領域迎來新突破,昆侖萬維旗下Skywork AI近日推出多模態視頻基礎模型SkyReels V4。該模型宣稱是全球首個同時具備多模態輸入、音視頻聯合生成以及統一處理生成、修復、編輯任務能力的視頻模型,標志著國內企業在這一賽道的技術競爭進入新階段。

第三方評測機構Artificial Analysis數據顯示,SkyReels V4在"文生視頻(帶音頻)歷史模型"榜單中躍居第四位,超越多數國際知名產品。測試樣本顯示,基于官方參考圖生成的15秒視頻片段,鏡頭切換流暢,音畫同步效果達到短劇制作水準,在AA榜單模型中展現出顯著優勢。

技術架構方面,該模型采用雙流多模態擴散Transformer(MMDiT)核心設計,實現1080p分辨率、32幀率、15秒時長音視頻同步輸出。其功能覆蓋主體替換、動作遷移、屬性修改、背景更換等編輯需求,支持中、英、日、韓、德、法等多語種文本合成,中文語音合成效果尤為突出,多項指標達到行業領先。

針對視頻生成工具的三大痛點,研發團隊提出創新解決方案。傳統工具存在音畫不同步問題,SkyReels V4的雙流架構讓視頻與音頻從任務初始便協同工作,通過雙向跨注意力機制提升角色嘴型、動作與聲音匹配度。面對高清長視頻生成算力消耗大的難題,模型采用"低分辨率全序列+高分辨率關鍵幀"聯合生成策略,先快速生成低分辨率完整視頻和高分辨率關鍵幀,再通過專用模塊重構高質量視頻,顯著降低制作門檻與成本。

行業生態變化為技術突破帶來新挑戰。上月字節跳動發布的Seedance2.0因版權問題遭遇國際訴訟,美國電影協會及六大制片廠聯合發函要求停止侵權。該模型隨后出現視頻質量下降、產出不穩定現象,演員王勁松公開控訴其形象被用于AI生成視頻,擔憂深度偽造技術可能成為詐騙工具。這類事件暴露出創作平權與版權保護的矛盾——當普通用戶無意使用IP素材生成視頻時,侵權行為將難以追責。

SkyReels V4的突破性進展與Seedance2.0的版權風波形成鮮明對比。中國AI企業想要在國際市場站穩腳跟,需要突破算力算法優勢之外的新維度,在數據合法性、合規成本等方面構建競爭壁壘。技術競賽與規則賽跑的格局,正在重塑視頻生成領域的全球競爭版圖。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新