原始文章

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在識別孕婦臨床筆記中的住房不安全性方面的效果。主要發現顯示,GPT-4在識別住房不穩定案例上表現優於GPT-3.5,回憶率達0.924,超過人類抽取者的0.702。雖然GPT-4的精確度低於人類,但在去識別筆記中略有提升。研究建議,雖然手動抽取準確性較高,LLMs如GPT-4提供了可擴展且具成本效益的選擇,適合半自動化抽取,但仍需人類審查以避免錯誤解釋。 PubMed DOI


站上相關主題文章列表

社會健康決定因素(SDoH)對病人的結果很重要,但常常沒有完整記錄在電子健康紀錄(EHRs)中。大型語言模型(LLMs)可以幫助從EHRs中提取SDoH數據。研究專注於從EHR敘述文本中提取六個SDoH類別。最佳模型是Flan-T5 XL,對任何SDoH提及進行微調,以及Flan-T5 XXL,對不良SDoH提及進行微調。合成數據提高了性能,尤其對較小的模型。這些模型在零次和少次訓練情況下優於ChatGPT模型,並在添加種族/族裔和性別描述詞時表現較少偏見。這些模型識別出比ICD-10代碼更多具有不良SDoH的病人,突顯了它們在改善有關SDoH的真實世界證據並識別需要支持的病人方面的潛力。 PubMed DOI

強調解決社會健康決定因素的重要性,特別是在COVID-19大流行時,以改善健康結果、減少健康不平等。討論數位健康和人工智慧在應對社會健康決定因素、增強疾病監測和病人照護的角色,如LLMs。提及數據標準化、基礎設施限制、數位素養和演算法偏見等挑戰,可能影響AI好處的公平獲取。建議採取多層次的數位包容作為社會健康決定因素的一部分,並全球性需要倫理AI框架,確保負責任的AI實踐。提出建議,彌合公平AI技術開發和實施之間的差距。 PubMed DOI

社會健康決定因素(SDoH)對健康影響很大,其中住房穩定性至關重要。電子健康記錄(EHRs)中包含有用的SDoH資訊,但常為非結構化,需要透過自然語言處理(NLP)進行分析。新的NLP技術如GPT-4能有效辨識住房不穩定性,雖然在偵測上有高召回率,但精確度較低。LLMs提供擴展且成本效益高的解決方案,同時召回率也較高。結合LLMs和人工審查可提高數據分析效率,支持醫療系統提供更主動的病人護理。 PubMed DOI

研究專注於從電子健康記錄中提取社會健康決定因素,以改善健康公平。研究建立跨機構數據集,開發分類模型,包括大型語言模型,從不同醫療機構的臨床註釋中檢測SDoH因素。研究發現不同病人群、註釋類型和醫院有不同的SDoH記錄實踐和標籤分佈。LLM在辨識SDoH因素方面表現最佳,但在跨數據集泛化上仍有挑戰。為促進合作,研究提供了PhysioNet存儲庫上的註釋數據集和模型訪問權。 PubMed DOI

研究評估了大型語言模型在醫療保健領域的應用,尤其是在改善患者護理方面。使用MIMIC-III數據庫的電子健康記錄,測試了這些模型在識別特定疾病患者方面的效能。GPT-4在辨識COPD、CKD、PBC和Cancer Cachexia患者方面表現優異,而ChatGPT和LLaMA3則稍遜。儘管LLMs有潛力,但在臨床應用前仍需解決錯誤、解釋不足和倫理問題。進一步研究將有助於提升模型訓練和設計,以更好地應用於醫療保健。 PubMed DOI

這項研究探討大型語言模型(LLMs)在生成重症監護病房(ICU)病人出院摘要的表現,分析了匿名臨床筆記。三個模型中,GPT-4 API的表現最佳,準確識別41.5%的關鍵臨床事件,ChatGPT和Llama 2則分別為19.2%和16.5%。雖然GPT-4在資訊組織和清晰度上表現優異,但仍有小錯誤,且所有模型在敘事連貫性和重要數據的捕捉上存在挑戰。總體來看,這些LLM在生成出院摘要上有潛力,但仍需改進。 PubMed DOI

這項研究探討大型語言模型(LLMs),特別是GPT-4和GPT-3.5,如何分析急診部報告以識別與腎結石相關的就診。研究使用標註過的數據集,透過提示優化和微調來提升模型表現。結果顯示,GPT-4的宏觀F1分數達0.833,明顯優於基準系統的0.71,而GPT-3.5則為0.796。研究還發現,GPT-4在種族和性別偏見方面表現良好,顯示出其在臨床文本分析的潛力。 PubMed DOI

這項研究評估了GPT-3.5這種大型語言模型在自動標記產科事件報告的效果。分析了370份住院產科報告,並以人類標註作為金標準。結果顯示,該模型的敏感度達85.7%,特異度為97.9%,使用了79個標籤,而人類僅用了49個。模型的標籤解釋也有60.8%獲得審核者認可。總體來看,GPT-3.5能提升事件報告系統的數據利用效率,並可能改善病人安全。 PubMed DOI

這項研究強調在醫療照護中評估健康社會決定因素(SDoH)的重要性,以改善病患照護並縮小健康差距。研究探討了電子健康紀錄(EHRs)中SDoH數據不足的挑戰,主要因為缺乏標準化的診斷代碼。研究團隊使用大型語言模型(如BERT和RoBERTa)來分類無家可歸、食物不安全和家庭暴力等SDoH概念,並創建合成訓練數據集。結果顯示,這些模型能有效提取SDoH資訊,幫助醫療提供者識別高風險病患,進而實施針對性干預,支持減少健康差距的努力。 PubMed DOI

這項研究探討了機器學習在電子健康紀錄中識別社會和行為健康決定因素的效果。研究人員分析了MIMIC-III數據集中的超過200萬份臨床筆記,使用潛在語義索引(LSI)和GPT模型來預測SBDH類別。結果顯示,LSI的正向預測值超過83%,在多個SBDH類別的預測準確性上優於ICD-9編碼。雖然GPT-4表現稍佳,但LSI在成本效益和處理文件數量上更具優勢。整體而言,LSI是一種有效且實用的方法,適合應用於健康系統。 PubMed DOI