巨人財經 - 專業科技行業財經媒體

李彥宏堅稱不做視頻生成模型,大廠到底要不要做Sora?

   發布時間:2024-10-23 09:00 作者:江紫萱

最近幾年,人工智能的高速發展帶來了整個市場的全面變革,除了大家熟悉的大模型之外,以Sora為代表的視頻生成模型也非常受到市場的關注,不過就在最近李彥宏堅稱不做視頻生成模型,我們該怎么看這件事?

一、李彥宏堅稱不做視頻生成模型

據界面新聞的報道,百度CEO李彥宏稱“百度不做Sora”的演講被媒體曝光后,有關“中國版Sora到底值不值得做”的話題又在微博、小紅書等社交媒體引發眾多爭論。

李彥宏在內部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業務收益,無論多火爆,百度都不去做。

反對的聲音認為,這屬于百度自身業務的問題。國內目前在視頻生成模型上最有希望的公司是快手和字節跳動,二者的業務離視頻更近,待其視頻生成足夠優秀之后會快速完成拉新,并帶動用戶體驗提升。

快手和字節跳動是國內互聯網大廠中積極布局視頻生成大模型的公司。Sora發布后,快手便推出文生視頻大模型“可靈”,其背后的技術原理和OpenAI的Sora類似,都是把常用于視頻生成人工智能的擴散模型與Transformer架構相結合,依托于快手短視頻平臺,擁有大量可用于訓練的視頻數據?!翱伸`”發布幾個月之后,字節跳動旗下火山引擎發布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型,面向企業市場開啟邀測。

除字節跳動和快手之外,今年發布視頻生成模型的公司還包括阿里云、Minimax、生數科技、智譜AI等公司。

二、大廠到底要不要做Sora?

近來,李彥宏堅稱不做視頻生成模型的決策,引發了廣泛的討論。究竟大廠要不要做視頻生成模型,成為了一個值得深入探討的問題,我們該怎么看這件事?

首先,李彥宏的判斷首先基于一個不容忽視的事實:視頻生成模型的算力需求極為龐大。相比于文本生成模型,視頻內容因其包含的動態信息豐富性,對模型的計算能力和存儲需求呈指數級增長。以Sora模型為例,其作為視頻生成領域的佼佼者,訓練和推理階段所需的算力分別達到了GPT-4的4.5倍和近400倍。這一數據直觀地揭示了視頻生成模型在算力上的“黑洞效應”,對任何一家科技公司而言,都是一項巨大的資源投入。

更重要的是,隨著視頻數據量的爆炸式增長,對計算效率和成本的控制成為了制約視頻生成技術普及的關鍵因素。對于大廠而言,計算成本和效率的平衡是至關重要的。在資源有限的情況下,必須謹慎地選擇投入的方向,以確保獲得最大的回報。

其次,對于百度而言,其在AI領域的布局已經形成了較為清晰的生態位。文心大模型作為百度的核心競爭力之一,通過在自然語言處理、圖像識別等領域的深耕,已經構建起了一定的市場壁壘和用戶基礎。在此情境下,李彥宏選擇不涉足視頻生成模型,可能是基于對現有資源分配的深思熟慮。

一方面,將寶貴資源投入到仍處于初級階段的視頻生成模型上,可能會分散百度在文心大模型優化、應用拓展等方面的精力,影響其在已建立優勢領域的深化布局。另一方面,視頻生成模型的商業化路徑尚未清晰,短期內難以形成有效的收入流,這對于任何一家企業而言,都是需要考慮的風險因素。

第三,大廠要不要做視頻大模型,關鍵在于如何判斷趨勢。目前,視頻大模型在商業化上的形勢仍然不夠明朗。雖然視頻市場具有巨大的潛力,但視頻大模型的商業化面臨著諸多挑戰。

一方面,視頻大模型的技術發展仍處于初級階段。雖然生成式 AI 技術為視頻生成帶來了新的可能性,但目前視頻大模型的生成效果還不能完全滿足用戶的需求。例如,視頻的畫質、流暢度、內容的豐富度等方面還有待提高。

另一方面,視頻大模型的商業化模式尚未明確。目前,視頻大模型的應用場景主要集中在一些特定的領域,如影視制作、廣告制作等。但這些領域的市場規模相對較小,且競爭激烈。同時,視頻大模型的版權問題、內容審核等問題也給商業化帶來了一定的困難。在這種情況下,大廠需要謹慎地評估視頻大模型的商業化前景,避免盲目投入資源。

第四,李彥宏關于是否進入視頻生成領域的決定,本質上反映了一個企業在特定歷史時期的策略選擇。雖然短期內可能看不到直接的回報,但從長遠角度來看,保持專注并持續優化已有業務,或許更能為企業帶來持續穩定的增長動力。

不過,值得注意的是,盡管現階段百度選擇了暫時觀望的態度,但這并不意味著視頻生成不會成為未來某個時間點上的重要發展方向。隨著技術的進步和社會需求的變化,這一領域的潛力仍然巨大,只是何時能夠實現真正的突破,則需要各家企業根據自身情況做出靈活調整。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新