原始文章

物質使用障礙(SUD)是影響個人健康與社會福祉的重要議題。診斷與治療SUD需考量多種因素,但現行的診斷系統如ICD-10常缺乏必要細節,醫師需依賴DSM-5補充資訊。傳統自然語言處理(NLP)在解讀臨床語言上有困難,但大型語言模型(LLMs)顯示出潛力。本研究探討如何利用LLMs從臨床筆記中提取SUD的嚴重程度資訊,實驗結果顯示開源LLM Flan-T5在召回率上優於傳統方法,能有效提升SUD患者的風險評估與治療規劃。 PubMed DOI


站上相關主題文章列表

社會健康決定因素(SDoH)對病人的結果很重要,但常常沒有完整記錄在電子健康紀錄(EHRs)中。大型語言模型(LLMs)可以幫助從EHRs中提取SDoH數據。研究專注於從EHR敘述文本中提取六個SDoH類別。最佳模型是Flan-T5 XL,對任何SDoH提及進行微調,以及Flan-T5 XXL,對不良SDoH提及進行微調。合成數據提高了性能,尤其對較小的模型。這些模型在零次和少次訓練情況下優於ChatGPT模型,並在添加種族/族裔和性別描述詞時表現較少偏見。這些模型識別出比ICD-10代碼更多具有不良SDoH的病人,突顯了它們在改善有關SDoH的真實世界證據並識別需要支持的病人方面的潛力。 PubMed DOI

社會健康決定因素(SDoH)對健康影響很大,其中住房穩定性至關重要。電子健康記錄(EHRs)中包含有用的SDoH資訊,但常為非結構化,需要透過自然語言處理(NLP)進行分析。新的NLP技術如GPT-4能有效辨識住房不穩定性,雖然在偵測上有高召回率,但精確度較低。LLMs提供擴展且成本效益高的解決方案,同時召回率也較高。結合LLMs和人工審查可提高數據分析效率,支持醫療系統提供更主動的病人護理。 PubMed DOI

這項研究探討了使用GPT-3.5語言模型,從MIMIC-III數據集中提取有關煙草、酒精和藥物使用的資訊,特別是病人出院摘要。研究強調了解行為因素對改善健康結果的重要性。雖然傳統自然語言處理方法面臨挑戰,但大型語言模型顯示出潛力。研究採用零樣本和少樣本學習技術,結果顯示零樣本學習在提取藥物使用提及方面有效,而少樣本學習則在評估使用狀態上表現更佳,雖然精確度有所下降。這強調了AI在電子健康紀錄中的應用潛力,有助於提升病人護理的個性化與有效性。 PubMed DOI

這項研究探討了機器學習在電子健康紀錄中識別社會和行為健康決定因素的效果。研究人員分析了MIMIC-III數據集中的超過200萬份臨床筆記,使用潛在語義索引(LSI)和GPT模型來預測SBDH類別。結果顯示,LSI的正向預測值超過83%,在多個SBDH類別的預測準確性上優於ICD-9編碼。雖然GPT-4表現稍佳,但LSI在成本效益和處理文件數量上更具優勢。整體而言,LSI是一種有效且實用的方法,適合應用於健康系統。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是Llama-2,如何在電子健康紀錄(EHRs)中檢測精神科入院紀錄的自殺風險。研究人員評估了不同Llama-2模型在100份精神科報告上的表現,並與專家定義的真實情況進行比較。經過德國微調的Llama-2模型表現最佳,準確率達87.5%,敏感性83.0%,特異性91.8%。結果顯示,LLMs能有效提取自殺相關資訊,並保持數據隱私,顯示其在監測精神科緊急情況及增強自殺管理上的潛在應用價值。 PubMed DOI

這項研究評估了六種大型語言模型(LLMs)在從病人筆記中提取ICD-10-CM代碼的表現,並與人類編碼員進行比較。結果顯示,人類編碼員提取了165個代碼,而LLMs提取的數量明顯更多,Llama 2-70b以658個代碼領先。GPT-4與人類的協議百分比最高,但整體協議程度極低。Claude 3在主要診斷方面表現最佳。研究指出,LLMs在提取過程中存在不一致,整體表現仍不及人類編碼員。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來識別青少年抑鬱症訪談中的心理治療結果。作者建立了一個編碼框架,能夠捕捉多樣的治療結果,並評估五個開源LLM的分類能力。實驗結果顯示,這些模型能有效分類31種結果,ROC曲線下面積得分在0.6到1.0之間,成功識別出友誼和學業表現等重要結果。研究強調了臨床數據的應用,顯示詳細編碼治療結果的可行性,並有助於量化重要結果。 PubMed DOI

這項研究評估了一個大型語言模型(LLM)在監測兒童注意力不足過動症(ADHD)藥物副作用的有效性。研究回顧了2015至2022年間社區初級醫療網絡中6至11歲ADHD兒童的電子健康紀錄。LLaMA模型經過ADHD相關臨床筆記訓練,並與醫療紀錄進行人工審查,顯示高敏感性(87.2%)和特異性(86.3%),AUC為0.93。主要發現包括:模型不受性別或保險類型影響,電話就診的副作用詢問記錄顯著低於其他就診方式。研究結論指出,LLM可有效衡量護理質量並改善ADHD藥物管理。 PubMed DOI

這項研究探討開源大型語言模型(LLMs)在從電子健康紀錄(EHRs)中提取社會健康決定因素(SDoH)數據的效果。研究隨機選取200名患者,並由兩位審查者手動標記九個SDoH方面,達成93%的高一致性。結果顯示,LLMs的表現明顯優於基準模型,特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力,以提升LLMs在臨床研究中的應用,最終改善醫療結果。 PubMed DOI

SBDH-Reader是一個創新的工具,利用大型語言模型從醫療筆記中提取社會和行為健康決定因素(SBDH)數據。這個工具基於7,225份MIMIC-III數據庫的醫療筆記訓練,並在UT Southwestern Medical Center的971份病人筆記上測試,專注於就業、住房、婚姻關係和物質使用等六個類別。性能指標顯示,SBDH-Reader在各類別中取得了0.85到0.98的宏觀平均F1分數,特別是在識別不良屬性方面表現優異。總體而言,這個工具能有效提升臨床研究和病人照護的數據提取能力。 PubMed DOI