中國移動首創智算推理集群“黃金標準” 引領行業邁向高質量發展新階段

發布時間：2025-12-30 08:23 來源：快訊作者：楊凌霄

在人工智能技術加速從“模型訓練”向“推理部署”轉型的關鍵階段，中國移動攜手合作伙伴在智算運營領域實現重大創新，推出全球首個“智算推理集群運營黃金標準”。該標準通過構建可量化、可評估的集群效能評估體系，首次實現對AI推理算力服務質量的標準化度量，為行業破解“降本增效”與“服務保障”的雙重挑戰提供了系統性解決方案。

當前，AI推理應用已深度滲透政務、金融、制造、醫療等核心領域，驅動算力需求結構發生根本性轉變。數據顯示，推理算力在智算基礎設施中的占比持續攀升，成為支撐智能體生態發展的核心負載。然而，用戶對高性能、低成本、優體驗的復合需求，與行業在資源調度、效能優化等方面的能力短板形成鮮明矛盾。如何在保障服務質量的前提下，實現推理系統的經濟高效運行，成為智算基礎設施建設的關鍵命題。

中國移動提出的“黃金標準”以“度量破局”為核心，創新構建四大維度評估體系：用戶體驗指標聚焦響應延遲、服務穩定性等關鍵參數；系統并發能力指標衡量集群處理峰值請求的能力；系統可用性指標確保服務連續性；硬件利用率指標則覆蓋算力、顯存、帶寬等核心資源。通過實時監測集群運行狀態，該體系可精準識別不同場景下最先觸達性能瓶頸的“黃金指標”，為擴容優化提供科學依據。

在試點驗證階段，中國移動針對DeepSeek-R1等MoE稀疏模型、Qwen3-32B等稠密模型、Qwen2.5-VL-72B等多模態理解模型，以及Stable Diffusion等生成模型，開展全場景實測。測試發現，不同模型在算力利用率、顯存帶寬利用率等四項硬件指標上的增長速率存在顯著差異，且各場景的性能瓶頸指標各不相同。例如，多模態生成模型在顯存帶寬利用率上更易達到臨界點，而大語言模型則對算力利用率更為敏感。

基于“黃金指標”的動態監控機制，企業可實現精細化運營：當資源利用率低于閾值時，系統自動引入負載提升效能；當指標接近擴容臨界點時，觸發彈性擴容流程。實踐表明，該機制可使擴容決策準確率提升至近100%，顯著降低運營成本。以某金融場景為例，通過優化顯存利用率指標，集群整體效能提升35%，同時將服務延遲控制在毫秒級。

作為國家“人工智能+”戰略的踐行者，中國移動正以“三位一體”定位（人工智能供給者、匯聚者、運營者）推動技術普惠。通過升級“AI+”行動計劃，公司持續強化智算基礎設施底座建設，創新運營模式，推動算力供給向綠色智能方向演進。目前，其開放的應用場景已覆蓋千行百業，加速AI技術在實體經濟中的規模化落地，為經濟社會數字化轉型注入新動能。

更多>同類內容