原始文章

物質使用障礙(SUD)是影響個人健康與社會福祉的重要議題。診斷與治療SUD需考量多種因素,但現行的診斷系統如ICD-10常缺乏必要細節,醫師需依賴DSM-5補充資訊。傳統自然語言處理(NLP)在解讀臨床語言上有困難,但大型語言模型(LLMs)顯示出潛力。本研究探討如何利用LLMs從臨床筆記中提取SUD的嚴重程度資訊,實驗結果顯示開源LLM Flan-T5在召回率上優於傳統方法,能有效提升SUD患者的風險評估與治療規劃。 PubMed DOI


站上相關主題文章列表

這項研究探討開源大型語言模型(LLMs)在從電子健康紀錄(EHRs)中提取社會健康決定因素(SDoH)數據的效果。研究隨機選取200名患者,並由兩位審查者手動標記九個SDoH方面,達成93%的高一致性。結果顯示,LLMs的表現明顯優於基準模型,特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力,以提升LLMs在臨床研究中的應用,最終改善醫療結果。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs),如BART和GPT-4,從MedHelp論壇的用戶評論中識別藥物停用事件(DDEs)。DDEs對藥物依從性和病人結果至關重要,但研究仍不多。研究人員建立了一個靈活的框架,並發布了首個開源DDE數據集,以促進後續研究。結果顯示,GPT-4o在識別根本原因上表現優異,而BART在檢測DDEs方面最有效。這項研究顯示了LLMs在分析公開數據的潛力,並鼓勵進一步探索。 PubMed DOI

這項研究探討了使用開源大型語言模型Llama 3,分析2018至2023年間去中心化臨床試驗(DCTs)的趨勢,並解決試驗登記中術語不標準的問題。研究人員從ClinicalTrials.gov獲取數據,使用三個不同版本的Llama 3模型進行DCT分類和提取去中心化元素。結果顯示,微調模型能提高敏感性,但正確預測值較低,需專注於DCT術語。最終識別出692個DCT,主要為第二期試驗,顯示大型語言模型在分析非結構化臨床數據的潛力,並強調管理模型偏見的重要性。 PubMed DOI

SBDH-Reader是一個創新的工具,利用大型語言模型從醫療筆記中提取社會和行為健康決定因素(SBDH)數據。這個工具基於7,225份MIMIC-III數據庫的醫療筆記訓練,並在UT Southwestern Medical Center的971份病人筆記上測試,專注於就業、住房、婚姻關係和物質使用等六個類別。性能指標顯示,SBDH-Reader在各類別中取得了0.85到0.98的宏觀平均F1分數,特別是在識別不良屬性方面表現優異。總體而言,這個工具能有效提升臨床研究和病人照護的數據提取能力。 PubMed DOI

這項研究探討病人自報結果量表(PROMs),特別是PHQ-9,對門診抑鬱症治療紀錄質量的影響。研究分析了18,000份臨床筆記,重點在2019至2024年期間的就診紀錄。主要發現顯示,參與者平均年齡46.3歲,大多數為女性,PHQ-9平均分數較低,只有4.8%符合中度或以上的抑鬱症狀。雖然大型語言模型(LLM)能提供一些見解,但在移除實際分數後,準確性不佳,顯示依賴PROMs可能導致精神症狀紀錄不夠全面。 PubMed DOI

這篇研究針對電子病歷中難以提取健康社會決定因素(SDoH)問題,從四家醫院建立標註資料集,涵蓋21種SDoH,並用多種模型(包含大型語言模型)進行偵測。經過指令微調的LLMs表現最佳,F1值都很高,但模型跨醫院應用仍有困難。訓練好的模型已公開在GitHub。 PubMed DOI

在電子病歷中找出藥物不良事件(ADEs)很困難,因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時,所以需要自動化工具。這項研究用大型語言模型來偵測ADEs,發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯,顯示通報機制還有很大改進空間。 PubMed DOI

這項研究發現,大型語言模型和文字嵌入模型能從精神科病患的句子完成測驗中,準確辨識憂鬱症和自殺風險,尤其在分析自我概念相關內容時效果最好。最佳模型偵測憂鬱症的AUROC達0.841。雖然AI有潛力協助心理健康評估,但臨床應用前還需要更多改進和安全驗證。 PubMed DOI

這篇研究用標註過的出院摘要,建立大規模資料集,並用多種大型語言模型來偵測八種物質使用情形。經過微調的 Llama-DrugDetector-70B 模型,對大多數物質的偵測準確率很高(F1 分數 ≥ 0.95),但像鴉片類藥物和多重物質使用的偵測還有進步空間。整體來說,LLM 有助提升臨床紀錄中物質使用的辨識,但還需要更多研究才能廣泛應用。 PubMed DOI

這項研究比較多種大型語言模型,發現經過微調的GatorTronGPT在從臨床紀錄中擷取鴉片類藥物過量和使用障礙的關鍵資訊上表現最佳。結果顯示,生成式LLM能有效協助擷取相關資訊,對後續研究和介入措施很有幫助。 PubMed