MIT天才博士畢業即投身新銳公司聚焦大模型預訓練年薪或達300萬起

發布時間：2026-01-12 02:08 來源：快訊作者：朱天宇

MIT博士肖光烜近日在社交平臺宣布完成學業，即將加入由OpenAI前CTO創立的初創公司Thinking Machines，專注大模型預訓練領域。這一消息引發科技圈關注，英偉達科學家、xAI研究員及UCSD學者等業內人士紛紛在評論區送上祝賀。

翻開肖光烜的履歷，其學術背景堪稱亮眼。本科階段就讀于清華大學計算機系，同時輔修金融學并獲得雙學位，期間斬獲國家獎學金、全國大學生數學建模競賽一等獎等十余項榮譽。2020年至2021年，他以訪問學者身份赴斯坦福大學開展研究，2022年進入MIT攻讀博士學位，師從韓松教授，研究方向聚焦深度學習的高效算法與系統。

在MIT期間，肖光烜展現出極強的工程實踐能力。2024年初，他在英偉達實習期間提出的DuoAttention技術，通過結合檢索與流式注意力頭，成功解決長上下文大語言模型的推理加速問題。此后參與的XAttention項目，利用反對角評分機制實現塊稀疏注意力優化；StreamingVLM模型則突破視頻流處理時長限制，可實時分析數小時長視頻內容。這些成果均體現其從理論到落地的完整技術閉環能力。

其博士論文《Efficient Algorithms and Systems for Large Language Models》更被視為行業里程碑。針對大模型顯存爆炸、推理遲緩等痛點，論文提出SmoothQuant量化技術，首次實現十億級模型W8A8無損壓縮；StreamingLLM架構通過"注意力匯點"機制，將模型上下文處理能力從數千token提升至百萬級。更值得關注的是，團隊通過信噪比分析證明"塊越小越好"的理論極限，并開發FlashMoBA內核使小塊架構在實際應用中提速9倍，為AGI發展開辟新路徑。

科技行業薪酬數據印證了這場人才爭奪戰的激烈程度。據Business Insider獲取的2025年一季度招聘記錄顯示，Thinking Machines為技術員工開出平均46.25萬美元年薪，其中基礎薪資最高達50萬美元。這一水平不僅遠超OpenAI技術團隊29.2萬美元的平均年薪，也高于Anthropic的38.75萬美元。盡管與meta某些高管超億元薪酬仍有差距，但在初創公司中已屬頂尖水準。

更多>同類內容