原始文章

這項研究介紹了GRASP,一種基於變壓器的模型,旨在利用電子健康紀錄(EHR)數據來提升疾病預測的準確性。透過將醫療代碼整合進大型語言模型,GRASP能有效預測21種疾病及全因死亡率,並在多個醫療系統中表現優異。訓練於英國生物銀行的GRASP,在FinnGen和西奈山醫院的測試中,C指數分別提升了83%和35%。即使數據集未統一,GRASP仍能準確預測疾病風險,顯示出其在不同醫療系統中可靠的應用潛力。 PubMed DOI


站上相關主題文章列表

醫師需要快速做決定,預測模型能預測臨床事件,提供幫助。傳統模型有限制,但透過臨床註記訓練語言模型,可以打造更多功能的預測引擎。開發了醫學語言模型(NYUTron),並在預測再入院和死亡方面進行微調,比傳統模型更準確。對臨床文本進行預訓練,再針對不同地點進行微調,可以增強泛化能力。成功在試驗中應用,顯示臨床語言模型有潛力協助醫師即時做決定。 PubMed DOI

研究使用電子健康記錄進行表型分析時,需要準確的演算法,但開發這些演算法可能耗費大量時間。研究指出,使用大型語言模型(LLMs)能有效生成初步演算法,其中GPT-4和GPT-3.5在評估中表現較佳。然而,仍需要人類專業知識來完善這些演算法。 PubMed DOI

研究探討利用先進語言模型(LLMs)改善醫療數據互通,轉換及傳輸。實驗證實LLMs可有效將結構化數據轉為非結構化、映射診斷代碼及提取臨床資訊。結果顯示LLMs有潛力增進醫療數據交流,無需複雜標準化。 PubMed DOI

研究專注於從電子健康記錄中提取社會健康決定因素,以改善健康公平。研究建立跨機構數據集,開發分類模型,包括大型語言模型,從不同醫療機構的臨床註釋中檢測SDoH因素。研究發現不同病人群、註釋類型和醫院有不同的SDoH記錄實踐和標籤分佈。LLM在辨識SDoH因素方面表現最佳,但在跨數據集泛化上仍有挑戰。為促進合作,研究提供了PhysioNet存儲庫上的註釋數據集和模型訪問權。 PubMed DOI

這項研究開發了一個基於人工智慧的異常檢測模型,幫助醫療人員識別新型疾病並防止疫情擴散。模型使用來自麻薩諸塞州一所醫院的120,714名住院病人數據,基於生成預訓練變壓器(GPT)架構,並透過經驗風險最小化進行訓練。它分析電子健康紀錄,檢測不尋常的病人特徵,並在COVID-19疫情初期成功預測住院情況,達到92.2%的準確率。該模型在異常檢測和死亡預測上表現優異,顯示出在現代醫療中的潛力。 PubMed DOI

這篇論文探討基於變壓器的大型語言模型(LLMs)在生成合成表格健康數據的有效性,並與生成對抗網絡(GANs)進行比較,這對遵循隱私法規的醫療研究非常重要。研究分析了Pythia LLM Scaling Suite,模型參數從1400萬到10億,結果顯示較大的LLM在性能上優於GAN,甚至最小的LLM也能達到相似效果。此外,訓練數據集大小與模型性能呈正相關。論文還討論了在醫療領域實施LLM的挑戰與考量。 PubMed DOI

這項研究探討了機器學習在電子健康紀錄中識別社會和行為健康決定因素的效果。研究人員分析了MIMIC-III數據集中的超過200萬份臨床筆記,使用潛在語義索引(LSI)和GPT模型來預測SBDH類別。結果顯示,LSI的正向預測值超過83%,在多個SBDH類別的預測準確性上優於ICD-9編碼。雖然GPT-4表現稍佳,但LSI在成本效益和處理文件數量上更具優勢。整體而言,LSI是一種有效且實用的方法,適合應用於健康系統。 PubMed DOI

這項研究探討增強檢索生成(RAG)的大型語言模型(LLMs)在急診科臨床紀錄中生成ICD-10-CM代碼的有效性,並與醫療提供者進行比較。研究基於Mount Sinai Health System的500次急診就診數據,發現RAG增強的LLMs在準確性和特異性上均優於醫療提供者,且GPT-4的表現尤為突出。即使是較小的模型如Llama-3.1-70B,經過RAG後也顯示出顯著提升。這顯示生成式人工智慧在改善醫療編碼準確性及減少行政負擔方面的潛力。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在從電子健康紀錄中提取數據的表現,使用了50份合成醫療筆記。共測試了18個LLM,並與基準模型RoBERTa比較,涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等,準確率超過0.98,明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性,顯示出能有效協助數據提取,減輕醫療人員的負擔。不過,仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

這項研究探討開源大型語言模型(LLMs)在從電子健康紀錄(EHRs)中提取社會健康決定因素(SDoH)數據的效果。研究隨機選取200名患者,並由兩位審查者手動標記九個SDoH方面,達成93%的高一致性。結果顯示,LLMs的表現明顯優於基準模型,特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力,以提升LLMs在臨床研究中的應用,最終改善醫療結果。 PubMed DOI