鄔賀銓：2026年推理算力將占主導，智能體驅動云網算全面升級

發布時間：2026-04-17 21:32 來源：快訊作者：周琳

隨著人工智能與大模型技術的飛速發展，智能體正成為科技界和產業界的焦點。中國工程院院士鄔賀銓指出，到2026年，全球推理算力將占據AI算力總負載的70%至80%，而中國的推理需求預計將達到訓練需求的8倍。這一趨勢標志著算力的應用正從訓練主導轉向推理和智能體主導，推動算力架構、應用場景和商業模式發生深刻變革。從單輪生成到多步規劃，從被動問答到主動任務執行，智能體正在重新定義AI的應用邊界。

智能體并非傳統意義上的主機，而是一種基于大模型的能力和資源。單個智能體通過感知、記憶、規劃、工具調用和行動執行形成閉環，能夠獨立完成特定任務的決策和操作。然而，單一智能體的應用邊界和能力上限較為有限，難以處理復雜目標。為突破這一局限，多智能體協同系統應運而生。在統一協調器的調度下，相關智能體可以共享記憶、進行高級規劃和反思，從而涌現出集體智能，處理更復雜的任務。

多智能體的規模化互聯進一步催生了智能體互聯網（IoA）。與傳統互聯網實現主機和信息互聯不同，IoA擴展為智能體和能力的互聯。它以IPv6+為基礎，疊加新應用層協議，實現智能體的唯一標識、自主發現、可信交互和協同執行。智能體互聯網的頂層支撐是智能體即服務（AaaS），它將智能體和智能體群的能力云化封裝，通過API、SDK和低代碼平臺對外提供服務，支持租戶化、彈性調度和按需計費。

在面向消費者的（To C）領域，智能體主要有三種應用模式。第一種是云上APP寄生智能體，它強依賴微信、釘釘等宿主APP，依托云端算力運行，斷網后不可用。這類智能體作為APP內的AI插件，能夠基于用戶偏好自動完成操作，將聊天工具升級為具備“思考、寫作、讀文件、控設備”能力的智能助手。第二種是終端OS原生智能體，預裝于手機操作系統，如中興通訊與字節跳動聯合推出的豆包手機。它采用端云協同模式，可按用戶意圖調度APP并自動執行業務流程，但可能因過度主動而違背用戶臨時意愿。第三種是本地自治+云端輔助的智能體，如以“龍蝦”為代表的AI私人管家。它不依賴APP，但需手動安裝獨立PC軟件，決策和權限管理本地化，通過云上AaaS發現并協同其他智能體。

在面向企業（To B）的領域，智能體的應用模式更為多樣。流程自動化智能體通過復刻人工邏輯，替代生產、運維等標準化流程，提升效率。行業專家智能體依托行業知識庫和知識圖譜，為企業提供決策參謀方案。多智能體協同模式整合供應鏈、生產和物流等領域的智能體，實現跨環節協同。具身智能則支撐工業機器人等實體設備，完成感知、推理和物理執行的閉環。

智能體的發展對算力、云和網絡提出了顛覆性要求。與傳統互聯網業務相比，智能體業務的驅動主體從人工操作變為機器自主循環，運行時間從晝夜分明變為7×24小時不間斷，空間分布從集中式變為多點網狀調用。智能體的會話從短對話變為長上下文，流量從平穩變為“Token核爆”式增長，單智能體的Token消耗可達普通用戶的10至1000倍。

鄔賀銓表示，智能體對算力的需求推動了專用加速器的普及，如GPU和NPU。多智能體需同時占用多個隔離的“沙箱/進程”，并發密度激增，對顯存和帶寬提出極高要求。盡管Token流量年增速高達330%，但通過小模型普及、極致壓縮和長上下文優化，未來5年算力增速可控制在41%左右，實現效率與成本的平衡。

在云服務領域，智能體時代要求構建智能體原生云，優先布局智能體原生架構，構建全局智能調度，搭建分布式記憶和向量引擎，深化“云—邊—端”協同。這一趨勢正在重塑中國云服務格局，AI云全棧服務迎來爆發，市場向智算融合、綠色低碳和國產深化升級。

網絡層面，智能體的長會話持續交互、多智能體協同通信等特征，使網絡流量從南北向為主轉為東西向占比80%，QPS提升10至100倍。網絡架構需從行政區組網轉向智算中心—區域云—邊緣—終端四級架構，采用SRv6、云網虛擬化與編排技術、流量AI預測與調度等技術，保障確定性與高可靠性。

更多>同類內容