在人工智能技術加速從“模型訓練”向“推理部署”轉型的關鍵階段,中國移動攜手合作伙伴在智算運營領域實現重大創新,推出全球首個“智算推理集群運營黃金標準”。該標準通過構建可量化、可評估的集群效能評估體系,首次實現對AI推理算力服務質量的標準化度量,為行業破解“降本增效”與“服務保障”的雙重挑戰提供了系統性解決方案。
當前,AI推理應用已深度滲透政務、金融、制造、醫療等核心領域,驅動算力需求結構發生根本性轉變。數據顯示,推理算力在智算基礎設施中的占比持續攀升,成為支撐智能體生態發展的核心負載。然而,用戶對高性能、低成本、優體驗的復合需求,與行業在資源調度、效能優化等方面的能力短板形成鮮明矛盾。如何在保障服務質量的前提下,實現推理系統的經濟高效運行,成為智算基礎設施建設的關鍵命題。
中國移動提出的“黃金標準”以“度量破局”為核心,創新構建四大維度評估體系:用戶體驗指標聚焦響應延遲、服務穩定性等關鍵參數;系統并發能力指標衡量集群處理峰值請求的能力;系統可用性指標確保服務連續性;硬件利用率指標則覆蓋算力、顯存、帶寬等核心資源。通過實時監測集群運行狀態,該體系可精準識別不同場景下最先觸達性能瓶頸的“黃金指標”,為擴容優化提供科學依據。
在試點驗證階段,中國移動針對DeepSeek-R1等MoE稀疏模型、Qwen3-32B等稠密模型、Qwen2.5-VL-72B等多模態理解模型,以及Stable Diffusion等生成模型,開展全場景實測。測試發現,不同模型在算力利用率、顯存帶寬利用率等四項硬件指標上的增長速率存在顯著差異,且各場景的性能瓶頸指標各不相同。例如,多模態生成模型在顯存帶寬利用率上更易達到臨界點,而大語言模型則對算力利用率更為敏感。
基于“黃金指標”的動態監控機制,企業可實現精細化運營:當資源利用率低于閾值時,系統自動引入負載提升效能;當指標接近擴容臨界點時,觸發彈性擴容流程。實踐表明,該機制可使擴容決策準確率提升至近100%,顯著降低運營成本。以某金融場景為例,通過優化顯存利用率指標,集群整體效能提升35%,同時將服務延遲控制在毫秒級。
作為國家“人工智能+”戰略的踐行者,中國移動正以“三位一體”定位(人工智能供給者、匯聚者、運營者)推動技術普惠。通過升級“AI+”行動計劃,公司持續強化智算基礎設施底座建設,創新運營模式,推動算力供給向綠色智能方向演進。目前,其開放的應用場景已覆蓋千行百業,加速AI技術在實體經濟中的規模化落地,為經濟社會數字化轉型注入新動能。























