Evaluation and mitigation of the limitations of large language models in clinical decision-making.
評估和緩解大型語言模型在臨床決策中的限制。 Nat Med 2024-07-04

大型語言模型(LLMs)在臨床決策中或許有好處，但目前還不適合實際醫療使用。一項研究指出，LLMs在真實病例中無法正確診斷、無法遵循指引、難以解釋檢驗結果，且難以整合到臨床流程中，可能危害患者健康。需要更多研究以改進LLMs在臨床決策的應用。 PubMed DOI

Generative Large Language Models in Electronic Health Records for Patient Care Since 2023: A Systematic Review.
2023年以來生成大型語言模型在電子健康紀錄中的病患照護：系統性回顧。 medRxiv 2024-09-04

這項研究系統性回顧了生成性大型語言模型（LLMs）在臨床環境，特別是電子健康紀錄（EHRs）的應用。儘管自然語言處理技術進步，LLMs在臨床實踐中的整合仍有限，面臨多重挑戰。研究分析了自2023年以來的76篇相關文獻，發現包括提示工程的使用、少數多模態數據的應用、評估指標的多樣性，以及臨床決策中的偏見和幻覺等問題。未來需改進計算技術和標準化評估，以提升LLMs在醫療中的可靠性。總之，LLMs在病人護理上有潛力，但仍需克服重大障礙。 PubMed DOI

Large language models and synthetic health data: progress and prospects.
大型語言模型與合成健康數據：進展與前景。 JAMIA Open 2024-10-28

隨著醫療保健對先進分析的需求增加，合成健康數據的使用變得愈加重要，尤其是在獲取真實健康數據的挑戰下。大型語言模型（LLMs）的進展為生成合成健康數據提供了新機會，但也帶來潛在風險。本文綜述了合成健康數據生成（SHDG）及LLM的研究，探討生成對抗網絡等機器學習模型的現狀與局限性。SHDG面臨的挑戰包括評估指標、數據效率、健康公平等，雖然LLMs在某些方面顯示潛力，但深入研究其優缺點仍然至關重要。 PubMed DOI

Privacy preserving strategies for electronic health records in the era of large language models.
大型語言模型時代電子健康紀錄的隱私保護策略。 NPJ Digit Med 2025-01-19

電子健康紀錄（EHRs）與大型語言模型（LLMs）結合使用時，隱私挑戰不容忽視。雖然GDPR和HIPAA提供基本保護，但仍需具體策略來降低風險。可採用以下方法： 1. **本地部署LLMs**：在設備上運行，確保健康數據不外洩。 2. **合成數據生成**：創建模擬數據，保護病人隱私。 3. **差分隱私**：在數據中添加噪音，防止推斷個人信息。 4. **去識別化**：移除可識別信息，遵守隱私法規。透過這些策略，組織能在利用生成式AI的同時，強化病人隱私保護。 PubMed DOI

Robust privacy amidst innovation with large language models through a critical assessment of the risks.
在大型語言模型創新中的穩健隱私：對風險的批判性評估。 J Am Med Inform Assoc 2025-03-20

這項研究探討如何將電子健康紀錄（EHRs）與自然語言處理（NLP）及大型語言模型（LLMs）結合，以改善醫療數據管理和病人照護。研究使用MIMIC III數據集，採用GPT-3.5、GPT-4等模型生成符合HIPAA要求的合成病人紀錄。結果顯示，基於關鍵字的方法在隱私保護上風險較低，且保持良好性能，建議未來可考慮使用虛擬的PHI來提升實用性與隱私保護。 PubMed DOI

Evaluation and Bias Analysis of Large Language Models in Generating Synthetic Electronic Health Records: Comparative Study.
大型語言模型在生成合成電子健康紀錄的評估與偏誤分析：比較性研究 J Med Internet Res 2025-05-12

這項研究評估7種大型語言模型產生的14萬筆合成電子健康紀錄，發現模型越大，資料越完整，但性別和種族偏見也越明顯。性別偏見多反映現實疾病分布，種族偏見則不一致，部分模型高估White或Black患者，低估Hispanic和Asian族群。研究強調AI健康資料需兼顧準確性與公平性，並呼籲建立更完善的偏見評估標準。 PubMed DOI

Large Language Models in Medicine: Clinical Applications, Technical Challenges, and Ethical Considerations.
醫學中的大型語言模型：臨床應用、技術挑戰與倫理考量 Healthc Inform Res 2025-05-19

大型語言模型在醫療文件撰寫和決策輔助上很有潛力，但因準確性、驗證、偏見和隱私等問題，現階段還不適合完全自動化臨床應用。未來要安全有效導入，需加強研究、訂定明確規範，並維持人工監督。 PubMed DOI

Large Language Models Struggle in Token-Level Clinical Named Entity Recognition.
大型語言模型在臨床命名實體識別的詞元層級表現不佳 AMIA Annu Symp Proc 2025-05-26

這篇研究比較專有和開源大型語言模型在臨床文本中做 token-level 罕見疾病命名實體識別的表現。研究發現，雖然用了多種技術，LLMs 在這類任務上還是有不少困難，並針對醫療應用提出改進建議。 PubMed

DIRI: Adversarial Patient Reidentification with Large Language Models for Evaluating Clinical Text Anonymization.
DIRI：利用大型語言模型進行對抗性病患再識別以評估臨床文本去識別化 AMIA Jt Summits Transl Sci Proc 2025-06-12

這項研究提出用大型語言模型（LLM）來測試去識別化工具的隱私保護效果。結果發現，即使是先進工具，仍有9%病患紀錄被重新識別，顯示現有方法有漏洞。這方法有助於找出弱點，讓未來生醫資料分享更安全。 PubMed

Harnessing Moderate-Sized Language Models for Reliable Patient Data Deidentification in Emergency Department Records: Algorithm Development, Validation, and Implementation Study.
運用中等規模語言模型於急診部門紀錄中進行可靠的病患資料去識別化：演算法開發、驗證與實作研究 JMIR AI 2025-07-03

這項研究比較了幾款中型開源語言模型在去除法文臨床紀錄個資的表現，重點是能在一般電腦上運作。結果發現，Mistral 7B 微調後表現最好，準確率高達0.97，且幾乎不會改動原文內容。這方法能有效保護病患隱私，讓臨床資料更安全地用於醫療研究和系統優化。 PubMed DOI

原始文章

站上相關主題文章列表