巨人財經 - 專業科技行業財經媒體

麻省理工等借Apple Watch數據構建AI模型 挖掘健康數據潛力助力疾病預測

   發布時間:2025-12-11 16:09 作者:朱天宇

麻省理工學院與Empirical Health的研究團隊近日取得一項突破性進展,他們基于300萬“人-天”的Apple Watch健康數據,開發出一種新型自監督學習模型,在疾病預測領域展現出顯著優勢。這項研究通過創新的數據處理方式,成功解決了可穿戴設備數據不完整、不規則的難題,為健康監測技術開辟了新方向。

研究核心基于meta前首席AI科學家Yann LeCun提出的“聯合嵌入預測架構”(JEPA)。該架構突破傳統AI系統直接重建缺失數據的模式,轉而訓練模型從上下文推斷缺失部分的語義表征。例如在圖像處理中,系統不會嘗試還原被遮蔽區域的原始像素,而是通過可見部分推斷其抽象特征。這種思路被研究團隊創新性地應用于健康數據領域,特別是處理心率、睡眠時長等存在大量缺失的時間序列指標。

研究團隊構建的縱向數據集涵蓋16,522名參與者,累計記錄約300萬“人-天”的生理數據。每位參與者每日記錄63項指標,覆蓋心血管、呼吸、睡眠、運動等五大健康維度。值得注意的是,僅15%的參與者擁有完整醫療標注記錄,傳統監督學習框架下85%的數據難以利用。研究團隊通過自監督預訓練策略,先讓模型在無標注數據中學習通用特征,再針對特定疾病在少量標注數據上進行微調。

在數據處理環節,研究人員將每條觀測記錄轉化為包含日期、數值、指標類型的“三元組”,進而編碼為可學習的“token”。通過隨機掩碼部分token,模型需要預測被遮擋片段的嵌入表示。這種訓練方式使模型能夠捕捉數據中的潛在模式,即使面對極端不平衡的記錄頻率——某些指標僅0.4%的記錄時間出現,而另一些指標存在于99%的日常讀數中。

實驗結果顯示,新型模型在多項疾病預測任務中表現優異:高血壓預測的AUROC指標達到86.8%,慢性疲勞綜合征為81%,病態竇房結綜合征同樣取得86.8%的成績。雖然房撲預測的70.5%略低于部分基線模型,但整體性能優勢明顯。研究特別指出,AUROC和AUPRC指標反映的是模型對病例的排序能力,而非傳統意義上的預測準確率。

這項成果的重要價值在于證明了日常可穿戴設備的潛在價值。盡管Apple Watch等設備存在佩戴時間不固定、數據記錄不連續等問題,但通過創新的模型架構和訓練策略,仍能從海量數據中提取有效健康信號。研究團隊開發的JETS模型不僅為疾病早期預警提供了新工具,更展示了如何最大化利用不完整健康數據的可能性,為智能健康監測領域樹立了新的技術標桿。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新