從電子健康紀錄擷取健康社會決定因素很難,因為資料多是非結構化且類別不均。作者把UMLS語意知識結合進大型語言模型,來產生更多訓練資料,特別補足資料較少的類別。這方法能提升模型擷取SDoH資訊的效果,並已在MIMIC-SDoH資料集上驗證有效。 PubMed
這項研究發現,結合 soft prompt-based learning 和大型語言模型(像 GatorTronGPT),能大幅提升從不同醫院和疾病的臨床文本中萃取社會健康決定因素(SDoH)的效果。經過 prompt-tuning 的 GatorTronGPT,F1 分數最高比傳統 fine-tuned 模型多出 21.8%,顯示它在跨領域應用上表現更好。 PubMed
這項研究開發了一套自動化系統,運用大型語言模型和自然語言處理,從文獻中擷取健康社會決定因素,並結合阿茲海默症的生物資料建立知識圖譜。透過圖神經網路預測關聯,有助於了解社會因素對AD風險的影響,且方法也適用於其他健康議題。程式碼已公開在GitHub。 PubMed