在科技行業,一場圍繞Token的商業變革正悄然展開。英偉達與阿里巴巴,這兩家科技巨頭在相近時間內紛紛布局Token領域,引發了業界廣泛關注。Token,這個原本相對陌生的概念,正逐漸成為AI時代的關鍵要素。
英偉達CEO黃仁勛將Token形象地比喻為數字世界的石油。在AI應用場景中,無論是向ChatGPT提問、生成視頻,還是操控機器人,每一次操作都在消耗Token。它是AI理解和生成信息的基本單元,也是未來智能服務的計量標準。在英偉達的GTC 2026主題演講中,黃仁勛首次公開了Token的分層定價體系,這一體系并非紙上談兵,而是實實在在的收費標準。免費層以高吞吐量、低速度吸引用戶;基礎層每百萬Token收費3美元,面向普通用戶;進階層每百萬Token6美元,提供更大模型和更快速度;高速層每百萬Token45美元,支持長上下文和深度推理;頂級層每百萬Token高達150美元,服務于超長研究任務和關鍵路徑實時響應。黃仁勛還舉例說明,一個研究員每天使用5000萬Token,按頂級層價格計算,研究團隊也能接受。這表明Token具有持續性消耗的特點,只要AI持續運行,Token的需求就會源源不斷。
英偉達靠Token賺錢的核心在于CUDA,它堪稱AI世界的“操作系統”。所有AI應用都需運行在CUDA上,就如同手機應用依賴安卓或iOS系統。英偉達經過20年的努力,讓數億塊GPU搭載了CUDA系統,廣泛分布于各類云平臺、計算機公司以及眾多行業。龐大的安裝基數形成了強大的飛輪效應:安裝基數越大,越能吸引全球開發者;開發者創造出新算法,又會催生新市場;新市場對算力的需求增加,進一步擴大了安裝基數。這種循環使得算力成本持續下降。黃仁勛提到一個反直覺的例子,六年前出貨的Ampere架構GPU,如今在云端的定價反而上漲。原因在于這塊老芯片上能運行的應用越來越多,而且英偉達每次軟件優化,所有存量用戶都能免費獲得性能提升。這意味著用戶購買的算力不僅不會過時,反而可能增值。英偉達的商業模式由此清晰可見:以硬件建立安裝基數,通過軟件持續創造價值,依靠生態鎖定用戶。全球數億塊GPU運行CUDA,每個Token的消耗都離不開英偉達的平臺,企業從一次性購買AI卡轉變為持續購買Token作為“燃料”,英偉達則實現了持續“收租”。
與此同時,阿里巴巴也迅速行動。3月16日,阿里巴巴成立Alibaba Token Hub事業群,CEO吳泳銘親自掛帥,將業務目標分解為創造Token、輸送Token和應用Token三個方面。阿里如此急切布局Token領域,有著深刻的內部原因。過去兩年,阿里的AI業務分散在通義實驗室、阿里云、釘釘、淘天等多個體系,各團隊各自為戰,導致資源重復投入,協同成本高昂。用戶對阿里的AI產品也感到困惑,通義千問、千問App、夸克AI等基于同一技術的產品讓用戶難以分辨。12天前,“千問靈魂人物”林俊旸的離職,更是暴露了“科學家想發論文、管理層想要營收”的矛盾,這在AI行業并非個例。吳泳銘的應對策略十分直接,將Token作為唯一的評價標準。未來阿里的評價體系不再糾結于技術路線的對錯,而是以Token的調用量和營收來衡量。能夠帶來Token增長的部門將得到重視,反之則會被邊緣化。阿里判斷,未來數字化工作將由大量AI Agent支撐,而這些Agent的運行依賴于模型產生的Token。由于Agent不間斷工作,Token的需求將是持續且高頻的。
如果把Token比作AI時代的“電”,英偉達和阿里的角色定位十分清晰。英偉達如同“發電設備制造商”,通過銷售發電機、建設發電廠,并依靠CUDA生態鎖定客戶,讓所有AI應用都經過其平臺。阿里則扮演“電網公司+用電大戶”的角色,通義實驗室負責創造Token,MaaS平臺負責輸送Token,千問、悟空等產品負責消耗Token,試圖打通“發電 - 輸電 - 用電”的完整產業鏈。在這場競爭中,英偉達憑借技術壁壘和生態鎖定,在單位Token成本上具有顯著優勢;阿里則擁有豐富的場景和數據,電商、云、釘釘等業務每天產生和消耗海量數據與Token。若阿里能成功打通閉環,Token將在其體系內實現自我循環和增值。如今,兩家巨頭已在Token賽道上投入真金白銀,這場競爭的結果將深刻影響AI時代的商業格局。






















