隨著人工智能與大模型技術的飛速發展,智能體正成為科技界和產業界的焦點。中國工程院院士鄔賀銓指出,到2026年,全球推理算力將占據AI算力總負載的70%至80%,而中國的推理需求預計將達到訓練需求的8倍。這一趨勢標志著算力的應用正從訓練主導轉向推理和智能體主導,推動算力架構、應用場景和商業模式發生深刻變革。從單輪生成到多步規劃,從被動問答到主動任務執行,智能體正在重新定義AI的應用邊界。
智能體并非傳統意義上的主機,而是一種基于大模型的能力和資源。單個智能體通過感知、記憶、規劃、工具調用和行動執行形成閉環,能夠獨立完成特定任務的決策和操作。然而,單一智能體的應用邊界和能力上限較為有限,難以處理復雜目標。為突破這一局限,多智能體協同系統應運而生。在統一協調器的調度下,相關智能體可以共享記憶、進行高級規劃和反思,從而涌現出集體智能,處理更復雜的任務。
多智能體的規模化互聯進一步催生了智能體互聯網(IoA)。與傳統互聯網實現主機和信息互聯不同,IoA擴展為智能體和能力的互聯。它以IPv6+為基礎,疊加新應用層協議,實現智能體的唯一標識、自主發現、可信交互和協同執行。智能體互聯網的頂層支撐是智能體即服務(AaaS),它將智能體和智能體群的能力云化封裝,通過API、SDK和低代碼平臺對外提供服務,支持租戶化、彈性調度和按需計費。
在面向消費者的(To C)領域,智能體主要有三種應用模式。第一種是云上APP寄生智能體,它強依賴微信、釘釘等宿主APP,依托云端算力運行,斷網后不可用。這類智能體作為APP內的AI插件,能夠基于用戶偏好自動完成操作,將聊天工具升級為具備“思考、寫作、讀文件、控設備”能力的智能助手。第二種是終端OS原生智能體,預裝于手機操作系統,如中興通訊與字節跳動聯合推出的豆包手機。它采用端云協同模式,可按用戶意圖調度APP并自動執行業務流程,但可能因過度主動而違背用戶臨時意愿。第三種是本地自治+云端輔助的智能體,如以“龍蝦”為代表的AI私人管家。它不依賴APP,但需手動安裝獨立PC軟件,決策和權限管理本地化,通過云上AaaS發現并協同其他智能體。
在面向企業(To B)的領域,智能體的應用模式更為多樣。流程自動化智能體通過復刻人工邏輯,替代生產、運維等標準化流程,提升效率。行業專家智能體依托行業知識庫和知識圖譜,為企業提供決策參謀方案。多智能體協同模式整合供應鏈、生產和物流等領域的智能體,實現跨環節協同。具身智能則支撐工業機器人等實體設備,完成感知、推理和物理執行的閉環。
智能體的發展對算力、云和網絡提出了顛覆性要求。與傳統互聯網業務相比,智能體業務的驅動主體從人工操作變為機器自主循環,運行時間從晝夜分明變為7×24小時不間斷,空間分布從集中式變為多點網狀調用。智能體的會話從短對話變為長上下文,流量從平穩變為“Token核爆”式增長,單智能體的Token消耗可達普通用戶的10至1000倍。
鄔賀銓表示,智能體對算力的需求推動了專用加速器的普及,如GPU和NPU。多智能體需同時占用多個隔離的“沙箱/進程”,并發密度激增,對顯存和帶寬提出極高要求。盡管Token流量年增速高達330%,但通過小模型普及、極致壓縮和長上下文優化,未來5年算力增速可控制在41%左右,實現效率與成本的平衡。
在云服務領域,智能體時代要求構建智能體原生云,優先布局智能體原生架構,構建全局智能調度,搭建分布式記憶和向量引擎,深化“云—邊—端”協同。這一趨勢正在重塑中國云服務格局,AI云全棧服務迎來爆發,市場向智算融合、綠色低碳和國產深化升級。
網絡層面,智能體的長會話持續交互、多智能體協同通信等特征,使網絡流量從南北向為主轉為東西向占比80%,QPS提升10至100倍。網絡架構需從行政區組網轉向智算中心—區域云—邊緣—終端四級架構,采用SRv6、云網虛擬化與編排技術、流量AI預測與調度等技術,保障確定性與高可靠性。






















