MIT博士肖光烜近日在社交平臺宣布完成學業,即將加入由OpenAI前CTO創立的初創公司Thinking Machines,專注大模型預訓練領域。這一消息引發科技圈關注,英偉達科學家、xAI研究員及UCSD學者等業內人士紛紛在評論區送上祝賀。
翻開肖光烜的履歷,其學術背景堪稱亮眼。本科階段就讀于清華大學計算機系,同時輔修金融學并獲得雙學位,期間斬獲國家獎學金、全國大學生數學建模競賽一等獎等十余項榮譽。2020年至2021年,他以訪問學者身份赴斯坦福大學開展研究,2022年進入MIT攻讀博士學位,師從韓松教授,研究方向聚焦深度學習的高效算法與系統。
在MIT期間,肖光烜展現出極強的工程實踐能力。2024年初,他在英偉達實習期間提出的DuoAttention技術,通過結合檢索與流式注意力頭,成功解決長上下文大語言模型的推理加速問題。此后參與的XAttention項目,利用反對角評分機制實現塊稀疏注意力優化;StreamingVLM模型則突破視頻流處理時長限制,可實時分析數小時長視頻內容。這些成果均體現其從理論到落地的完整技術閉環能力。
其博士論文《Efficient Algorithms and Systems for Large Language Models》更被視為行業里程碑。針對大模型顯存爆炸、推理遲緩等痛點,論文提出SmoothQuant量化技術,首次實現十億級模型W8A8無損壓縮;StreamingLLM架構通過"注意力匯點"機制,將模型上下文處理能力從數千token提升至百萬級。更值得關注的是,團隊通過信噪比分析證明"塊越小越好"的理論極限,并開發FlashMoBA內核使小塊架構在實際應用中提速9倍,為AGI發展開辟新路徑。
科技行業薪酬數據印證了這場人才爭奪戰的激烈程度。據Business Insider獲取的2025年一季度招聘記錄顯示,Thinking Machines為技術員工開出平均46.25萬美元年薪,其中基礎薪資最高達50萬美元。這一水平不僅遠超OpenAI技術團隊29.2萬美元的平均年薪,也高于Anthropic的38.75萬美元。盡管與meta某些高管超億元薪酬仍有差距,但在初創公司中已屬頂尖水準。























