巨人財經 - 專業科技行業財經媒體

智能體深度應用詞元消耗激增 降本增效路在何方?

   發布時間:2026-04-04 05:15 作者:顧雨柔

隨著人工智能技術在各領域的滲透,關于大模型使用中Token消耗與成本控制的討論日益成為焦點。Token作為大模型處理信息的最小單元,無論是日常提問還是生成內容,每一次交互都伴隨著它的消耗。近期,智能體應用如“龍蝦”的興起,進一步推高了Token的使用需求,也讓成本問題愈發凸顯。

記者調查發現,智能體產品落地初期,簡單交互場景的成本變化并不顯著,但深度使用場景中,Token消耗量會呈指數級增長,直接推高使用成本。個人用戶秦先生表示:“任務復雜度稍有提升,成本就明顯增加,Token消耗與任務難度不成正比,超出預期。”企業層面的感受更為強烈——規模化應用AI的企業日均Token消耗已達百億級,以中交AI中心為例,其開發的數千個智能體日均消耗上百億Token,對應成本約十萬元。

持續增長的Token需求對算力系統構成挑戰。MiniMax稀宇科技副總裁嚴奕駿透露,公司每周都要進行算力擴容,算力資源始終處于“緊平衡”狀態。中國電信北京公司AI技術負責人陳哲詩觀察到,大模型技術演進拉動了應用層需求,算力租賃市場火爆,但客戶對成本敏感度較高,優化基礎設施效率、降低Token成本成為行業共同訴求。

Token與手機流量的計費邏輯本質不同。手機流量按傳輸量計費,緩存內容可重復使用,成本清晰可控;而Token作為AI處理信息的計量單位,用戶需支付模型空間占用費、服務套餐費,每條指令執行都會產生實時消耗,功能擴展或權限開放還會帶來額外支出。這種差異導致深度使用場景下,Token成本增長遠高于流量成本。

降低Token成本已成為行業共識。中國信息通信研究院云計算與數字化研究所主任馬飛分析,當前成本偏高源于行業處于發展初期,高端算力硬件成本高、資源利用率不足等多重因素疊加。隨著技術成熟和算力供給優化,單位Token成本將逐步下降,需求爆發也將倒逼產業加速迭代。

企業正在通過多路徑降本。月之暗面Kimi企業業務負責人黃震昕表示,公司通過底層模型架構創新提升效率,直接降低Token成本;階躍星辰首席技術官朱亦博提出“智價比”概念,強調在保持模型智力水平的同時盡可能壓縮成本。云服務機構則從資源配置入手,天翼云智算平臺產品專家王曼介紹,通過算電協同、算網融合調度等技術,持續優化成本結構。

國家層面算力布局為普惠化提供支撐。中國信通院發布的《算力互聯網體系架構研究報告》顯示,我國智能算力規模已居全球第二,但高端算力、核心算法仍存在外部依賴。當前,全國一體化算力網絡建設加速推進,通過統一調度優化資源配置,算力服務可觸達性顯著提升。同時,輕量化、低功耗本土大模型的發展,讓更多普通用戶能夠以較低成本享受AI服務。

中國信通院云計算與數字化研究所副所長栗蔚認為,Token作為AI產業度量衡,其消耗總量反映應用深度,成本則體現算法算力效率。要實現Token普惠化,需構建優質算法、持續優化模型,降低單Token算力消耗,并搭建隨需接入的算力節點網絡,讓AI服務真正走進千家萬戶。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新