近日,高德地圖宣布上線全球首款基于大模型技術的“視覺認知步導”系統——地標AI領航。該系統通過整合千問大模型、超億級地理興趣點(POI)數據及千萬級街景圖像,首次賦予導航系統“視覺感知+語言理解”的雙重空間智能,讓步行導航更貼近人類自然認知習慣。
傳統步行導航長期存在三大痛點:起步階段方向辨識困難、行程中距離感知模糊、臨近終點時定位不精準。高德研發團隊通過分析人類指路行為發現,人們習慣用“穿過藍色大樓”“右轉見紅色招牌”等具象化描述傳遞路線信息,其核心邏輯在于結合方向指引、地標錨定與場景上下文。為復現這種認知模式,系統需構建覆蓋真實世界的動態地理語義網絡。
技術實現層面,該系統依托三大基礎能力:包含1.2億個POI的數據庫、高精度步行路網拓撲結構,以及覆蓋全國主要城市的千萬級街景圖像庫。通過千問大模型的多模態分析能力,系統可自動識別道路設施、商業標識、建筑特征等實體,并評估其在視覺場景中的顯著程度。例如,在復雜路口會優先選擇地鐵標識、銀行招牌等高辨識度地標作為參照物。
為提升指引效率,系統采用雙重篩選機制:在空間維度上,僅在起步、轉向、偏航糾正等關鍵節點播報;在視覺維度上,通過算法評估地標的顏色對比度、尺寸大小、位置關系等特征,篩選出最易識別的參照物。播報文案設計摒棄機械式指令,轉而使用“左側第二個玻璃門”“經過星巴克后右轉”等口語化表達,并根據環境復雜度動態調整信息密度。
實際測試數據顯示,使用該系統的用戶在關鍵路口的路徑確認速度平均提升2秒,低頭查看手機的頻率下降37%。特別對于老年群體、帶兒童家庭及異地游客等場景,這種“直覺式導航”顯著降低了步行出行的認知負擔。系統目前已在200余個城市上線,后續將擴展至更多語言版本及特殊場景適配。























