巨人財經 - 專業科技行業財經媒體

螞蟻靈波四天四開源構建具身智能基座 谷歌緊隨其后開放世界模型體驗平臺

   發布時間:2026-01-30 21:03 作者:陳麗

全球人工智能領域近日迎來重大突破,中國科技企業螞蟻集團旗下靈波科技連續四天發布四大開源模型,引發行業震動。這一系列動作不僅展示了中國在具身智能領域的技術實力,更標志著世界模型競賽從封閉研發向開放生態的重大轉變。緊隨其后,谷歌宣布開放其世界模型項目體驗平臺,兩大科技巨頭的隔空交鋒,為AI發展開辟了新的競爭維度。

螞蟻靈波的開源攻勢始于空間感知模型LingBot-Depth的發布。該模型針對機器人三維視覺精度與可靠性進行優化,在國際基準測試中表現優異,為智能終端提供了更精準的空間理解能力。次日發布的具身大模型LingBot-VLA則基于超過2萬小時的真實機器人數據訓練,覆蓋9種主流雙臂機器人構型,通過少量演示數據即可實現高質量任務遷移,顯著降低了下游應用的適配成本。這兩款模型的開源,為具身智能的落地應用奠定了堅實基礎。

真正引發行業關注的是第三日發布的世界模型LingBot-World。該模型能夠為具身智能、自動駕駛及游戲開發提供高保真虛擬環境,其視頻生成質量、動態程度和長時一致性等指標可媲美谷歌同期發布的Genie 3模型。更引人注目的是,LingBot-World成功解決了視頻生成中的“長時漂移”難題,支持近10分鐘的連續穩定生成,并將交互延遲控制在1秒以內,用戶可通過文本或操作實時改變環境。這一突破為AI智能體的訓練提供了更高效、更經濟的解決方案。

螞蟻靈波的開源攻勢并未止步。第四日發布的具身世界模型LingBot-VA提出了自回歸視頻-動作世界建模框架,將視頻生成與機器人控制深度融合。該模型在生成“下一步世界狀態”的同時,直接推演并輸出對應的動作序列,使機器人能夠像人類一樣“邊推演、邊行動”。這一創新為“世界模型賦能具身操作”開辟了新路徑,與前幾日發布的模型形成完整技術閉環。

螞蟻靈波的開源策略得到了國際媒體的廣泛認可。德國財經媒體AdHocNews評論稱,LingBot-World為開發者提供了一個高品質、可實時控制的平臺,其性能與谷歌領先模型相當,但完全面向開發者開放。該媒體指出,這一舉措將極大加速實時智能體的發展,使機器人能夠在模擬環境中成千上萬次地演練復雜場景,既安全又經濟。法國科技媒體PauseHardware也認為,若LingBot-World在長時序一致性和控制能力上得到驗證,將推動具身智能領域邁向新階段。

面對螞蟻靈波的開源攻勢,谷歌迅速作出反應。在螞蟻靈波宣布世界模型開源后不到24小時,谷歌DeepMind宣布面向美國地區18歲以上的Google AI Ultra訂閱用戶開放其世界模型研究原型“Project Genie”的體驗。該原型基于Genie 3模型構建,允許用戶通過文本提示或上傳圖像創建、探索和混合生成交互式世界,聚焦“世界草圖繪制”“世界探索”和“世界混創”三大功能。然而,谷歌也坦承該原型尚處于早期階段,存在生成效果不夠逼真、操作延遲較高、單次生成時長限制為60秒等局限。

螞蟻靈波與谷歌的不同策略反映了兩者在生態構建上的差異。螞蟻靈波通過徹底開源,快速吸引開發者構建應用生態,旨在具身智能等新興領域確立事實標準,并反哺技術迭代。而谷歌則采取更為謹慎的“可控開放”策略,通過訂閱制面向高端用戶開放體驗入口,旨在收集用戶反饋并控制風險,同時保持其核心技術控制力。AI技術評測網站Gaga.art直接對比指出,LingBot-World在質量上與Google Genie 3相當,但完全面向開發者開放,這一差異或將影響未來AI生態的格局。

此次螞蟻靈波在核心模型上的開源舉措,被行業專家視為打破技術壁壘的重要一步。此前,這類高質量訓練環境通常是專有的,成本高昂,限制了中小開發者的參與。如今,隨著螞蟻靈波的開源,每位開發者都能接觸到工業標準技術,這將極大促進具身智能等領域的創新與發展。正如AdHocNews援引行業專家觀點稱,螞蟻集團的舉措正在重塑全球機器人領域的競爭格局,中國科技企業正逐步從技術追隨者轉變為規則制定者。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新