巨人財經 - 專業科技行業財經媒體

谷歌Fluid新突破:AI文生圖自回歸模型優于擴散模型?

   發布時間:2024-10-23 14:38 作者:陸辰風

谷歌DeepMind團隊與麻省理工學院(MIT)攜手,近日推出了一款名為“Fluid”的全新模型,該模型在文生圖領域取得了顯著突破。當模型參數規模達到105億時,其表現尤為出色。

在文生圖技術中,自回歸模型與擴散模型一直備受關注。其中,擴散模型因能生成高質量圖像而備受矚目,而自回歸模型則常用于文本生成。

然而,谷歌DeepMind與MIT團隊的研究發現,通過采用連續tokens和隨機生成順序,自回歸模型的性能和可擴展性得到了顯著提升。

連續tokens的使用減少了信息丟失,使模型能更好地重建圖像。而隨機生成順序則讓模型在理解整體圖像結構時表現更為出色。

在重要基準測試中,Fluid模型超越了Stable Diffusion 3擴散模型和谷歌此前的Parti自回歸模型。與Parti相比,Fluid在參數規模較小的情況下仍取得了相同的FID分數。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新