2025年,人工智能領域正經歷著前所未有的變革。當各類AI應用如雨后春筍般涌現,從文案創作到情感陪伴,從供應鏈重塑到智慧醫療,技術的甜美果實似乎已觸手可及。然而,在這片繁榮景象背后,上海的一批AI企業卻選擇了一條看似“逆流而上”的道路——持續深耕基礎大模型研究。
回顧2023年,中國AI行業曾上演過一場激烈的“百模大戰”。據統計,當時全國擁有10億參數以上的大模型近80個,100億參數級的大模型更是超過10個。然而,兩年后的今天,這場狂歡已逐漸平息,仍在堅持基礎大模型研究的企業已不足10家,其中商湯科技、稀宇科技、階躍星辰等上海企業成為中堅力量。
為何在應用層創新層出不窮的當下,這些企業仍執著于基礎研究?答案或許藏在谷歌的最新成果中。2025年11月,谷歌推出的新一代AI模型Gemini 3在LMArena排行榜上以1501分登頂,其數學能力測試得分率高達23.4%,遠超競爭對手。這一成就被視為谷歌在AI領域的“絕地反擊”,也印證了基礎研究的重要性。谷歌選擇堅持“理解生成一體化”路線,而非盲目追隨行業潮流,最終憑借耐力實現了技術突破。
這種堅持在國內同樣得到呼應。復旦大學計算機科學技術學院教授邱錫鵬曾指出,國內“百模大戰”期間,大模型同質化問題嚴重,基礎研究反而被忽視。以自然語言處理為例,2015年前該領域研究方向多樣,學者間交流頻繁,而當所有人都涌向語言模型賽道時,其他可能性被扼殺。這種現象凸顯了基礎研究在技術創新中的稀缺價值。
階躍星辰副總裁李璟的觀點代表了上海企業的共識:“基礎大模型的能力決定了應用的上限。”這家成立不到3年的企業已發布22款基座模型,其最新推出的Step 3模型在視覺感知和復雜推理方面表現突出。李璟強調,當前大模型技術尚未收斂,過早轉向應用開發可能面臨技術迭代風險,一旦底層架構發生根本性變革,前期投入可能付諸東流。
商湯科技的戰略調整提供了另一個典型案例。2024年底,這家成立十年的企業啟動業務重組,推出“1+X”戰略:將智能駕駛、家庭機器人、智慧醫療等應用業務整合為“X創新業務”,自身則聚焦生成式AI與視覺AI雙引擎。這一調整并非技術路線的試探,而是對核心能力的再聚焦。2025年,商湯推出的“開悟”世界模型3.0在真實世界建模能力上表現優異,其生成的視頻具備強時空一致性,甚至能與斯坦福大學World Labs的Marble模型展開競爭。
在應用層取得成功的企業同樣沒有放棄基礎研究。稀宇科技(Minimax)的產品覆蓋200多個國家和地區,個人用戶超2億,月活用戶達2700萬。然而,這家企業在2024年10月仍推出了文本大模型M2、視頻模型海螺2.3等“全家桶”技術。其中,M2模型以10B激活參數在全球權威測評中沖入前五,開源排名第一,其綜合成本僅為競爭對手Claude 4.5的8%,推理速度卻是后者的近兩倍。這種“高智能、低成本”的模式正在改寫AI領域的競爭規則。
學術界對技術路線的討論也日益活躍。復旦大學計算與智能創新學院教授張軍平提醒,當前AI研究可能偏離了正確方向——人類智能的進化應遵循“感知先行、認知隨后”的規律。與此同時,仍有學者堅持從“AI符號主義”路線中尋找突破,這種多元聲音的復蘇,為技術創新提供了更多可能性。
在創新成果觸手可及的時代,顛覆性突破往往誕生于冷門領域。上海AI企業的選擇,正是對這一規律的回應。當技術尚未收斂,一切皆有可能,而基礎研究正是捕捉這種可能性的關鍵。





















