AI浪潮中上海企業堅守初心：基礎大模型為何仍是“必爭之地”？

發布時間：2026-01-18 20:43 來源：快訊作者：顧雨柔

2025年，人工智能領域正經歷著前所未有的變革。當各類AI應用如雨后春筍般涌現，從文案創作到情感陪伴，從供應鏈重塑到智慧醫療，技術的甜美果實似乎已觸手可及。然而，在這片繁榮景象背后，上海的一批AI企業卻選擇了一條看似“逆流而上”的道路——持續深耕基礎大模型研究。

回顧2023年，中國AI行業曾上演過一場激烈的“百模大戰”。據統計，當時全國擁有10億參數以上的大模型近80個，100億參數級的大模型更是超過10個。然而，兩年后的今天，這場狂歡已逐漸平息，仍在堅持基礎大模型研究的企業已不足10家，其中商湯科技、稀宇科技、階躍星辰等上海企業成為中堅力量。

為何在應用層創新層出不窮的當下，這些企業仍執著于基礎研究？答案或許藏在谷歌的最新成果中。2025年11月，谷歌推出的新一代AI模型Gemini 3在LMArena排行榜上以1501分登頂，其數學能力測試得分率高達23.4%，遠超競爭對手。這一成就被視為谷歌在AI領域的“絕地反擊”，也印證了基礎研究的重要性。谷歌選擇堅持“理解生成一體化”路線，而非盲目追隨行業潮流，最終憑借耐力實現了技術突破。

這種堅持在國內同樣得到呼應。復旦大學計算機科學技術學院教授邱錫鵬曾指出，國內“百模大戰”期間，大模型同質化問題嚴重，基礎研究反而被忽視。以自然語言處理為例，2015年前該領域研究方向多樣，學者間交流頻繁，而當所有人都涌向語言模型賽道時，其他可能性被扼殺。這種現象凸顯了基礎研究在技術創新中的稀缺價值。

階躍星辰副總裁李璟的觀點代表了上海企業的共識：“基礎大模型的能力決定了應用的上限。”這家成立不到3年的企業已發布22款基座模型，其最新推出的Step 3模型在視覺感知和復雜推理方面表現突出。李璟強調，當前大模型技術尚未收斂，過早轉向應用開發可能面臨技術迭代風險，一旦底層架構發生根本性變革，前期投入可能付諸東流。

商湯科技的戰略調整提供了另一個典型案例。2024年底，這家成立十年的企業啟動業務重組，推出“1+X”戰略：將智能駕駛、家庭機器人、智慧醫療等應用業務整合為“X創新業務”，自身則聚焦生成式AI與視覺AI雙引擎。這一調整并非技術路線的試探，而是對核心能力的再聚焦。2025年，商湯推出的“開悟”世界模型3.0在真實世界建模能力上表現優異，其生成的視頻具備強時空一致性，甚至能與斯坦福大學World Labs的Marble模型展開競爭。

在應用層取得成功的企業同樣沒有放棄基礎研究。稀宇科技（Minimax）的產品覆蓋200多個國家和地區，個人用戶超2億，月活用戶達2700萬。然而，這家企業在2024年10月仍推出了文本大模型M2、視頻模型海螺2.3等“全家桶”技術。其中，M2模型以10B激活參數在全球權威測評中沖入前五，開源排名第一，其綜合成本僅為競爭對手Claude 4.5的8%，推理速度卻是后者的近兩倍。這種“高智能、低成本”的模式正在改寫AI領域的競爭規則。

學術界對技術路線的討論也日益活躍。復旦大學計算與智能創新學院教授張軍平提醒，當前AI研究可能偏離了正確方向——人類智能的進化應遵循“感知先行、認知隨后”的規律。與此同時，仍有學者堅持從“AI符號主義”路線中尋找突破，這種多元聲音的復蘇，為技術創新提供了更多可能性。

在創新成果觸手可及的時代，顛覆性突破往往誕生于冷門領域。上海AI企業的選擇，正是對這一規律的回應。當技術尚未收斂，一切皆有可能，而基礎研究正是捕捉這種可能性的關鍵。

更多>同類內容