巨人財經 - 專業科技行業財經媒體

百度文心5.0正式版上線,2.4萬億參數賦能,技術骨干亮相引領AI新篇

   發布時間:2026-01-24 09:03 作者:周琳

百度近日正式推出文心5.0原生全模態大模型,標志著國內人工智能領域在多模態技術方向上取得重大突破。該模型參數規模達2.4萬億,采用創新的原生全模態統一建模架構,突破傳統多模態技術"后期融合"的局限,實現文本、圖像、視頻、音頻等多元數據在統一模型框架中的深度協同訓練。這一技術路線使模型具備原生全模態理解與生成能力,在40余項權威基準測試中,語言與多模態理解能力超越國際主流模型,穩居全球第一梯隊。

在技術架構層面,文心5.0創新性地采用超大規模混合專家結構,通過超稀疏激活參數設計將激活參數比控制在3%以下,在保持模型強大性能的同時顯著提升推理效率。模型開發團隊基于大規模工具環境構建長程任務軌跡數據,結合思維鏈與行動鏈的端到端強化學習訓練方法,使模型在智能體交互和工具調用能力上實現質的飛躍。這種技術突破為AI在復雜場景中的應用奠定了堅實基礎。

百度集團副總裁吳甜在發布會上強調,文心5.0的技術路線與業界普遍采用的"后期融合"方案存在本質差異。通過將多源數據在統一自回歸架構中進行聯合訓練,模型實現了多模態特征的深度融合與協同優化,這種原生全模態建模方式使模型能夠更自然地處理跨模態任務。例如在圖像生成場景中,模型可以同時理解文字描述、語音指令和參考圖像,生成更符合用戶預期的視覺內容。

應用模型研發部負責人賈磊現場展示了三項突破性技術:基于聲音Token的端到端合成大模型通過離散語音表示、MoE韻律建模和Unet聲學編碼等技術,實現了更自然的語音合成效果;5分鐘直播技術通過少量音色采樣和韻律模式匹配,使合成語音具備專業主播的情緒表現力;實時交互數字人技術采用三態Token聯動架構,突破傳統數字人制作模式,實現文本、語音、視頻的流式控制,顯著降低制作成本。這些技術已應用于羅永浩數字人直播等場景,創造行業新紀錄。

為推動大模型技術落地,百度千帆平臺推出Agent Infra解決方案,提供包含文心5.0在內的150余個場景化模型服務,集成百度AI搜索等工具鏈,結合數據管理和企業級服務能力,為企業打造全周期、多場景的業務運行環境。目前平臺已孵化超130萬個智能體應用,以百度AI搜索為代表的工具日均調用量突破千萬次,形成完整的"芯云模體"技術生態閉環。

相較于國際主流AI應用仍以對話交互為主的現狀,文心5.0的技術突破為AI在真實行業場景中的深度應用開辟新路徑。通過構建從芯片到智能云,再到模型應用的完整技術棧,百度正在探索一條具有中國特色的AI發展道路。這種全棧自研的生態閉環,不僅提升了技術自主性,更為金融、醫療、教育等垂直領域提供了可定制化的智能解決方案。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新