這項研究開發了一套自動化系統,運用大型語言模型和自然語言處理,從文獻中擷取健康社會決定因素,並結合阿茲海默症的生物資料建立知識圖譜。透過圖神經網路預測關聯,有助於了解社會因素對AD風險的影響,且方法也適用於其他健康議題。程式碼已公開在GitHub。 PubMed
從電子健康紀錄擷取健康社會決定因素很難,因為資料多是非結構化且類別不均。作者把UMLS語意知識結合進大型語言模型,來產生更多訓練資料,特別補足資料較少的類別。這方法能提升模型擷取SDoH資訊的效果,並已在MIMIC-SDoH資料集上驗證有效。 PubMed