巨人財經 - 專業科技行業財經媒體

Waymo聯手谷歌Gemini,打造全新端到端自動駕駛模型,未來出行或將大變革?

   發布時間:2024-10-31 17:22 作者:柳晴雪

自動駕駛領域的佼佼者Waymo近日宣布,其正在研發一種全新的訓練模型,該模型基于谷歌的多模態大語言模型Gemini。這一動態標志著Waymo在自動駕駛技術上又邁出了重要一步,試圖借助AI研究的深厚積淀來進一步鞏固其市場領先地位。

Waymo發布的研究論文詳細介紹了名為“端到端多模態自動駕駛模型”(EMMA)的新技術。該技術能夠處理并分析傳感器數據,為自動駕駛車輛生成未來的行駛軌跡,從而協助車輛做出更為精準和安全的決策。

這是自動駕駛領域首次展露出將多模態大語言模型應用于實際業務的跡象。此前,這類模型主要應用于聊天機器人、電子郵件管理等領域,而如今其應用范圍有望擴展至自動駕駛這一高科技領域。

傳統自動駕駛系統通常由多個特定功能的模塊組成,如感知、映射、預測和規劃等。盡管這些模塊在過去取得了一定的成效,但它們之間的誤差積累和通信限制問題也日益凸顯。面對新環境時,這些預定義模塊往往顯得力不從心。

Waymo認為,Gemini等MLLM模型的出現為解決上述問題提供了可能。這些模型經過海量互聯網數據的訓練,擁有豐富的世界知識,并展現出卓越的推理能力。在Waymo的測試中,EMMA模型在處理復雜環境時表現出色,如遇到動物穿越道路或道路施工時,能夠迅速為無人駕駛汽車規劃出合理的行駛路線。

然而,EMMA模型也存在一定的局限性。例如,它目前還無法整合來自激光雷達或雷達的3D傳感器輸入,這在一定程度上限制了其應用范圍。同時,多模態大語言模型可能存在的“幻覺”問題也為無人駕駛汽車的安全性帶來了挑戰。

盡管如此,Waymo的這一創新嘗試仍被視為自動駕駛領域的一大突破。隨著技術的不斷進步和完善,相信未來無人駕駛汽車將會更加智能、安全和高效。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新