高德地標AI領航上線：以視覺認知重構步行導航，讓出行更“直覺”高效

發布時間：2026-03-07 01:04 來源：互聯網作者：蘇婉清

近日，高德地圖宣布上線全球首款基于大模型技術的“視覺認知步導”系統——地標AI領航。該系統通過整合千問大模型、超億級地理興趣點（POI）數據及千萬級街景圖像，首次賦予導航系統“視覺感知+語言理解”的雙重空間智能，讓步行導航更貼近人類自然認知習慣。

傳統步行導航長期存在三大痛點：起步階段方向辨識困難、行程中距離感知模糊、臨近終點時定位不精準。高德研發團隊通過分析人類指路行為發現，人們習慣用“穿過藍色大樓”“右轉見紅色招牌”等具象化描述傳遞路線信息，其核心邏輯在于結合方向指引、地標錨定與場景上下文。為復現這種認知模式，系統需構建覆蓋真實世界的動態地理語義網絡。

技術實現層面，該系統依托三大基礎能力：包含1.2億個POI的數據庫、高精度步行路網拓撲結構，以及覆蓋全國主要城市的千萬級街景圖像庫。通過千問大模型的多模態分析能力，系統可自動識別道路設施、商業標識、建筑特征等實體，并評估其在視覺場景中的顯著程度。例如，在復雜路口會優先選擇地鐵標識、銀行招牌等高辨識度地標作為參照物。

為提升指引效率，系統采用雙重篩選機制：在空間維度上，僅在起步、轉向、偏航糾正等關鍵節點播報；在視覺維度上，通過算法評估地標的顏色對比度、尺寸大小、位置關系等特征，篩選出最易識別的參照物。播報文案設計摒棄機械式指令，轉而使用“左側第二個玻璃門”“經過星巴克后右轉”等口語化表達，并根據環境復雜度動態調整信息密度。

實際測試數據顯示，使用該系統的用戶在關鍵路口的路徑確認速度平均提升2秒，低頭查看手機的頻率下降37%。特別對于老年群體、帶兒童家庭及異地游客等場景，這種“直覺式導航”顯著降低了步行出行的認知負擔。系統目前已在200余個城市上線，后續將擴展至更多語言版本及特殊場景適配。

更多>同類內容