上海發布萬億參數科學大模型，國產算力支撐，賦能多學科科研新突破

發布時間：2026-02-05 07:04 來源：快訊作者：唐云澤

上海人工智能實驗室近日宣布，全球首個基于“通專融合”架構的萬億參數科學多模態大模型——Intern（書生）-S1-Pro正式開源。這一突破性成果不僅刷新了科學智能領域的參數規模紀錄，更以卓越性能躋身全球頂尖行列，標志著科學發現方式正從“工具輔助”向“智能驅動”全面升級。

該模型采用創新的混合專家架構（MoE），內部集成512個虛擬“學科專家”，面對具體問題時僅需激活8個最相關專家進行協同分析。這種“精準點將”機制使萬億級參數模型僅需調用2%的算力（約220億參數），即可完成復雜數理邏輯推理。實驗室負責人特別指出，模型通過引入“傅里葉位置編碼”技術重構時序編碼器，實現了對科學數據密度的動態適應——既能捕捉天文學中極其微弱的信號，也能處理生命科學領域百萬級實驗數據，如同擁有同時觀察“沙粒細節”與“沙丘輪廓”的雙重視覺。

在基礎學科能力驗證中，該模型展現出跨學科綜合優勢。國際數學奧林匹克（IMO-Answer-Bench）和國際物理奧林匹克（IPhO2025）測試顯示，其解題能力達到競賽級水準。更引人注目的是，在SciReasoner等跨學科評測中，模型表現優于多數閉源商業模型，成功構建起覆蓋化學、材料、生命、地球、物理五大領域的100余個專業任務矩陣。從解析分子結構到預測理化性質，從邏輯推理到捕捉數據因果關系，模型已具備支撐前沿科研的完整能力鏈。

技術自主性是該項目的另一大亮點。研發團隊通過“路由稠密估計”等策略實現計算芯片負載均衡，結合算法與系統協同創新，突破了超大規模模型訓練的效率瓶頸。在硬件層面，模型與昇騰計算生態深度適配，從底層算子優化到上層訓練框架形成完整技術棧。近期與沐曦芯片的聯合研發，更進一步夯實了國產算力基礎，為構建開放共享的科學智能基礎設施提供關鍵支撐。

目前，包含語言、多模態、強推理模型的書生系列開源體系已吸引全球數十萬開發者參與。實驗室宣布將持續推動全鏈條開源與免費商用，通過降低科研門檻促進全球學術與產業協作，共同塑造開放高效的科學人工智能新生態。

更多>同類內容