清華大學高性能計算研究中心的背景為清程極智的創立奠定了堅實的基礎。這支來自清華大學計算機系的團隊,憑借其在超大規模算力集群方面的豐富經驗,決定投身AI Infra賽道,致力于解決AI算力系統的核心問題。清程極智由湯雄超博士擔任CEO,翟季冬教授作為首席科學家,自去年年底成立以來,已經在商業化方面取得了顯著進展,與多家芯片廠商、算力中心、AI應用開發商以及基礎模型預訓練廠商達成了合作。
清程極智的核心技術壁壘在于其超大規模集群的調優能力,這使得他們在國產算力生態中具有顯著的優勢。據湯雄超介紹,目前國內AI Infra賽道中,只有他們的團隊具備十萬臺服務器規模的國產算力集群使用和調優經驗。這種能力對于智算中心來說至關重要,尤其是在面臨大規模算力需求時。他認為,未來的智算中心可能會回歸同一型號GPU的架構,以獲得更高的效率,而AI大模型訓練的核心仍然在于大規模算力系統本身。

除了AI訓練面臨的挑戰,清程極智也看到了推理側的機會。他們認為,訓推一體機很難滿足未來的AI業務全部需求,因為訓練和推理兩種業務對算力系統的需求區別較大。因此,清程極智選擇為推理業務量身定制相應的軟硬一體化算力系統,并通過云端算力提供MaaS大模型推理服務。
在商業化方面,清程極智已經與多家芯片廠商、算力中心、AI應用開發商以及基礎模型預訓練廠商達成了合作。云廠商也是他們的合作對象之一。湯雄超認為,云廠商過去解決的問題與現在需要解決的問題并不完全相同,他們在分布式資源合并方面的經驗市場上還較為稀缺,而這恰好是清程極智團隊的優勢所在。
對于國內芯片廠商的差異化,湯雄超也有深刻的體會。他認為,隨著國產芯片市場的發展,未來國產芯片市場會有一定程度的收斂,但不會完全集中到一家,并且國產芯片的性價比超越海外產品也只是時間問題。

清程極智的MaaS平臺提供了文本對話和文生圖等多種大模型服務能力,并且支持國產算力平臺,成本控制較低。他們相信,大模型應用一定會起量,并且在一個足夠大的市場里,同一個細分市場可以容得下好幾家廠商。因此,他們并不擔心與通用大模型公司的競爭,而是專注于提供高性能的推理加速能力和多樣化的產品交付形式。
在談到國產芯片廠商和異構混訓時,湯雄超表示,他們也在做異構混訓的工作,但認為同構集群可能是更高效的解決方案。他認為,隨著國產芯片產能的提升,智算中心最終會回歸到同構的基礎架構里。對于國內GPU芯片廠商的未來,他認為可能會出現一定程度的集中和收斂,但不太可能出現一家獨大的情況。
在談到算力硬件的最優解時,湯雄超認為,從目前的大模型形態來看,GPU或類GPU架構是較好的選擇。然而,他也指出,如果上層應用發生巨變的話,底層的算力也會受到影響。對于國內而言,他認為專用芯片與通用芯片并存是一個可能的發展趨勢。
最后,對于如何找到國產算力的護城河,湯雄超認為,應該從上層應用的需求出發,有針對性地進行補全和提升。他相信,國產算力系統在未來會有一些突破機會,而不需要完全復制CUDA生態。

總的來說,清程極智憑借其在超大規模集群調優方面的技術優勢,以及在推理側業務的定制化解決方案,已經在AI Infra賽道上取得了顯著的進展。他們相信,隨著國產算力生態的發展和完善,未來會有更多的機會和挑戰等待著他們。




















