原始文章

這篇研究用標註過的出院摘要,建立大規模資料集,並用多種大型語言模型來偵測八種物質使用情形。經過微調的 Llama-DrugDetector-70B 模型,對大多數物質的偵測準確率很高(F1 分數 ≥ 0.95),但像鴉片類藥物和多重物質使用的偵測還有進步空間。整體來說,LLM 有助提升臨床紀錄中物質使用的辨識,但還需要更多研究才能廣泛應用。 PubMed DOI


站上相關主題文章列表

這項研究探討開源大型語言模型(LLMs)在從電子健康紀錄(EHRs)中提取社會健康決定因素(SDoH)數據的效果。研究隨機選取200名患者,並由兩位審查者手動標記九個SDoH方面,達成93%的高一致性。結果顯示,LLMs的表現明顯優於基準模型,特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力,以提升LLMs在臨床研究中的應用,最終改善醫療結果。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs),如BART和GPT-4,從MedHelp論壇的用戶評論中識別藥物停用事件(DDEs)。DDEs對藥物依從性和病人結果至關重要,但研究仍不多。研究人員建立了一個靈活的框架,並發布了首個開源DDE數據集,以促進後續研究。結果顯示,GPT-4o在識別根本原因上表現優異,而BART在檢測DDEs方面最有效。這項研究顯示了LLMs在分析公開數據的潛力,並鼓勵進一步探索。 PubMed DOI

物質使用障礙(SUD)是影響個人健康與社會福祉的重要議題。診斷與治療SUD需考量多種因素,但現行的診斷系統如ICD-10常缺乏必要細節,醫師需依賴DSM-5補充資訊。傳統自然語言處理(NLP)在解讀臨床語言上有困難,但大型語言模型(LLMs)顯示出潛力。本研究探討如何利用LLMs從臨床筆記中提取SUD的嚴重程度資訊,實驗結果顯示開源LLM Flan-T5在召回率上優於傳統方法,能有效提升SUD患者的風險評估與治療規劃。 PubMed DOI

這項研究開發了一種利用大型語言模型(LLMs)從電子健康紀錄(EHR)中識別健康狀況的策略,解決了手動標記的繁瑣問題。研究將2015年的心臟登記隊列與阿爾伯塔省的EHR系統結合,分析臨床筆記以檢測急性心肌梗塞、糖尿病和高血壓。結果顯示,LLM方法在敏感度和陰性預測值上優於傳統ICD代碼,且檢測趨勢穩定。這種方法有潛力提升EHR在即時疾病監測中的應用效率。 PubMed DOI

這篇研究針對電子病歷中難以提取健康社會決定因素(SDoH)問題,從四家醫院建立標註資料集,涵蓋21種SDoH,並用多種模型(包含大型語言模型)進行偵測。經過指令微調的LLMs表現最佳,F1值都很高,但模型跨醫院應用仍有困難。訓練好的模型已公開在GitHub。 PubMed DOI

這篇論文用大型語言模型產生了1.7萬則帶有不良藥物事件標註的合成推文,解決社群媒體上缺乏標註資料的問題。用這些資料預訓練的NER模型,在真實推文上表現更好,經人工標註資料微調後更創新高,證明合成資料能大幅提升ADE偵測效果,且資料集已公開。 PubMed DOI

在電子病歷中找出藥物不良事件(ADEs)很困難,因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時,所以需要自動化工具。這項研究用大型語言模型來偵測ADEs,發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯,顯示通報機制還有很大改進空間。 PubMed DOI

這項研究發現,經過微調的 LLaMA-2 70B 模型,能有效運用電子病歷稽核紀錄來預測病人出院時間,表現比 GPT-4 和 DeBERTa 更好。採用「首次出現」事件序列化和 logit 輸出,預測更準確,顯示 LLMs 結合聰明資料處理,在臨床預測上很有潛力。 PubMed

**重點摘要:** 這項研究測試了兩個大型語言模型(LLMs),用來從真實的臨床紀錄自動產生出院摘要,並用一個經過驗證的評分指標來評分他們的結果。兩個模型的表現差不多,顯示LLMs有潛力協助醫師準備出院摘要,進而減輕臨床醫師的行政工作負擔。 PubMed DOI

這項研究比較多種大型語言模型,發現經過微調的GatorTronGPT在從臨床紀錄中擷取鴉片類藥物過量和使用障礙的關鍵資訊上表現最佳。結果顯示,生成式LLM能有效協助擷取相關資訊,對後續研究和介入措施很有幫助。 PubMed