巨人財經 - 專業科技行業財經媒體

上海發布萬億參數科學大模型,國產算力支撐,賦能多學科科研新突破

   發布時間:2026-02-05 07:04 作者:唐云澤

上海人工智能實驗室近日宣布,全球首個基于“通專融合”架構的萬億參數科學多模態大模型——Intern(書生)-S1-Pro正式開源。這一突破性成果不僅刷新了科學智能領域的參數規模紀錄,更以卓越性能躋身全球頂尖行列,標志著科學發現方式正從“工具輔助”向“智能驅動”全面升級。

該模型采用創新的混合專家架構(MoE),內部集成512個虛擬“學科專家”,面對具體問題時僅需激活8個最相關專家進行協同分析。這種“精準點將”機制使萬億級參數模型僅需調用2%的算力(約220億參數),即可完成復雜數理邏輯推理。實驗室負責人特別指出,模型通過引入“傅里葉位置編碼”技術重構時序編碼器,實現了對科學數據密度的動態適應——既能捕捉天文學中極其微弱的信號,也能處理生命科學領域百萬級實驗數據,如同擁有同時觀察“沙粒細節”與“沙丘輪廓”的雙重視覺。

在基礎學科能力驗證中,該模型展現出跨學科綜合優勢。國際數學奧林匹克(IMO-Answer-Bench)和國際物理奧林匹克(IPhO2025)測試顯示,其解題能力達到競賽級水準。更引人注目的是,在SciReasoner等跨學科評測中,模型表現優于多數閉源商業模型,成功構建起覆蓋化學、材料、生命、地球、物理五大領域的100余個專業任務矩陣。從解析分子結構到預測理化性質,從邏輯推理到捕捉數據因果關系,模型已具備支撐前沿科研的完整能力鏈。

技術自主性是該項目的另一大亮點。研發團隊通過“路由稠密估計”等策略實現計算芯片負載均衡,結合算法與系統協同創新,突破了超大規模模型訓練的效率瓶頸。在硬件層面,模型與昇騰計算生態深度適配,從底層算子優化到上層訓練框架形成完整技術棧。近期與沐曦芯片的聯合研發,更進一步夯實了國產算力基礎,為構建開放共享的科學智能基礎設施提供關鍵支撐。

目前,包含語言、多模態、強推理模型的書生系列開源體系已吸引全球數十萬開發者參與。實驗室宣布將持續推動全鏈條開源與免費商用,通過降低科研門檻促進全球學術與產業協作,共同塑造開放高效的科學人工智能新生態。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新