Unlocking the Secrets Behind Advanced Artificial Intelligence Language Models in Deidentifying Chinese-English Mixed Clinical Text: Development and Validation Study.
揭開先進人工智慧語言模型在去識別中英混合臨床文本中的秘密：發展與驗證研究。 J Med Internet Res 2024-02-11

在使用電子病歷時，為了保護隱私，必須刪除受保護的健康資訊。研究發現，語言模型在識別代碼混合文本中的PHI方面有潛力，但需考慮規則性和未知詞彙的影響。建議在醫療環境中使用大型語言模型進行提示式學習，並重視數據安全性。未來研究可探討如何利用外部知識來提高PHI識別的準確性。 PubMed DOI

Generative Large Language Models in Electronic Health Records for Patient Care Since 2023: A Systematic Review.
2023年以來生成大型語言模型在電子健康紀錄中的病患照護：系統性回顧。 medRxiv 2024-09-04

這項研究系統性回顧了生成性大型語言模型（LLMs）在臨床環境，特別是電子健康紀錄（EHRs）的應用。儘管自然語言處理技術進步，LLMs在臨床實踐中的整合仍有限，面臨多重挑戰。研究分析了自2023年以來的76篇相關文獻，發現包括提示工程的使用、少數多模態數據的應用、評估指標的多樣性，以及臨床決策中的偏見和幻覺等問題。未來需改進計算技術和標準化評估，以提升LLMs在醫療中的可靠性。總之，LLMs在病人護理上有潛力，但仍需克服重大障礙。 PubMed DOI

Privacy-preserving large language models for structured medical information retrieval.
隱私保護的大型語言模型在結構化醫療信息檢索中的應用。 NPJ Digit Med 2024-09-20

這項研究介紹了一個開源流程，利用本地的大型語言模型（LLM）"Llama 2" 從臨床文本中提取定量數據，專注於識別失代償性肝硬化的特徵。研究在MIMIC IV數據集中測試500名患者的病歷，成功識別五個關鍵臨床特徵，敏感度達100%，特異度96%。此外，對其他病症的檢測也相當高，顯示出本地部署的LLM在提取臨床信息方面的有效性，且硬體需求低。 PubMed DOI

Large language models and synthetic health data: progress and prospects.
大型語言模型與合成健康數據：進展與前景。 JAMIA Open 2024-10-28

隨著醫療保健對先進分析的需求增加，合成健康數據的使用變得愈加重要，尤其是在獲取真實健康數據的挑戰下。大型語言模型（LLMs）的進展為生成合成健康數據提供了新機會，但也帶來潛在風險。本文綜述了合成健康數據生成（SHDG）及LLM的研究，探討生成對抗網絡等機器學習模型的現狀與局限性。SHDG面臨的挑戰包括評估指標、數據效率、健康公平等，雖然LLMs在某些方面顯示潛力，但深入研究其優缺點仍然至關重要。 PubMed DOI

Automated anonymization of radiology reports: comparison of publicly available natural language processing and large language models.
放射科報告的自動匿名化：公開可用的自然語言處理與大型語言模型的比較。 Eur Radiol 2024-10-31

這項研究分析了不同的自然語言處理（NLP）模型和大型語言模型（LLM）在放射科報告中匿名化個人健康資訊（PHI）的效果，並遵循HIPAA法規。研究發現，兩個NLP模型成功移除了所有日期、醫療紀錄號碼和檢查號碼，而LLM在日期的移除效果較差。針對準確性優化的NLP模型表現最佳，達到完美的F1分數。研究結論指出，預訓練的NLP模型在不影響臨床數據的情況下，更有效地進行匿名化，LLM則可能意外刪除重要資訊，強調了可靠的PHI匿名化對醫療應用的重要性。 PubMed DOI

De-identification is not enough: a comparison between de-identified and synthetic clinical notes.
去識別化不足：去識別化與合成臨床筆記的比較。 Sci Rep 2024-11-29

這項研究探討使用臨床筆記進行研究時，去識別化和合成數據生成在隱私保護上的有效性。主要發現包括： 1. 去識別化的臨床筆記無法完全防止成員推斷攻擊，可能洩露特定數據。 2. 開發了一種新方法，利用大型語言模型生成合成臨床筆記。 3. 合成筆記在臨床任務中的表現與真實筆記相似。 4. 雖然合成筆記表現良好，但仍面臨與真實筆記相似的隱私問題。研究建議需進一步探索合成臨床筆記的替代方法，以提升隱私保障。 PubMed DOI

Privacy preserving strategies for electronic health records in the era of large language models.
大型語言模型時代電子健康紀錄的隱私保護策略。 NPJ Digit Med 2025-01-19

電子健康紀錄（EHRs）與大型語言模型（LLMs）結合使用時，隱私挑戰不容忽視。雖然GDPR和HIPAA提供基本保護，但仍需具體策略來降低風險。可採用以下方法： 1. **本地部署LLMs**：在設備上運行，確保健康數據不外洩。 2. **合成數據生成**：創建模擬數據，保護病人隱私。 3. **差分隱私**：在數據中添加噪音，防止推斷個人信息。 4. **去識別化**：移除可識別信息，遵守隱私法規。透過這些策略，組織能在利用生成式AI的同時，強化病人隱私保護。 PubMed DOI

Development of secure infrastructure for advancing generative artificial intelligence research in healthcare at an academic medical center.
在學術醫療中心推進醫療領域生成性人工智慧研究的安全基礎設施發展。 J Am Med Inform Assoc 2025-01-21

這項研究著重於建立安全的基礎設施，以便在醫療保健中使用大型語言模型（LLMs），特別針對數據安全和病人隱私的問題，並確保符合HIPAA規範。研究團隊在私有的Azure OpenAI Studio上部署，提供安全的API端點，並測試了兩個應用：從電子健康紀錄中檢測跌倒，以及評估心理健康預測中的偏見。這個框架成功確保了病人隱私，讓研究人員能安全處理敏感數據，為醫療機構提供可擴展的解決方案。 PubMed DOI

Evaluating GPT models for clinical note de-identification.
評估 GPT 模型在臨床筆記去識別化中的應用。 Sci Rep 2025-01-31

這項研究顯示，GPT-4在去識別化臨床筆記和生成合成數據方面，比GPT-3.5更有效，對於保護病人隱私非常重要。透過API存取和零樣本提示，GPT-4的表現相當出色，精確度達0.9925，召回率0.8318，F1分數0.8973，準確率0.9911。這些結果顯示，GPT-4能顯著提升臨床數據的安全性，並促進其在研究中的應用，為醫療數據管理中平衡數據效用與隱私樹立了新標準。 PubMed DOI

Large language models generating synthetic clinical datasets: a feasibility and comparative analysis with real-world perioperative data.
大型語言模型生成合成臨床數據集：可行性及與真實世界圍手術數據的比較分析。 Front Artif Intell 2025-02-20

這項研究探討使用OpenAI的GPT-4o生成合成臨床數據，以解決隱私法規和數據稀缺的問題。研究分為兩個階段：第一階段根據13個臨床參數創建了6,166個案例的結構化數據集，數據合理且準確；第二階段則利用真實的圍手術期數據集VitalDB生成數據，結果顯示92.31%的參數與VitalDB相似，且大多數參數間無顯著差異。研究顯示GPT-4o能有效生成反映實際臨床數據的合成數據，未來應進一步提高數據真實性並探索大型語言模型的潛力。 PubMed DOI

原始文章

站上相關主題文章列表