Evaluating GPT models for clinical note de-identification.
評估 GPT 模型在臨床筆記去識別化中的應用。 Sci Rep 2025-01-31

這項研究顯示，GPT-4在去識別化臨床筆記和生成合成數據方面，比GPT-3.5更有效，對於保護病人隱私非常重要。透過API存取和零樣本提示，GPT-4的表現相當出色，精確度達0.9925，召回率0.8318，F1分數0.8973，準確率0.9911。這些結果顯示，GPT-4能顯著提升臨床數據的安全性，並促進其在研究中的應用，為醫療數據管理中平衡數據效用與隱私樹立了新標準。 PubMed DOI

Large language models generating synthetic clinical datasets: a feasibility and comparative analysis with real-world perioperative data.
大型語言模型生成合成臨床數據集：可行性及與真實世界圍手術數據的比較分析。 Front Artif Intell 2025-02-20

這項研究探討使用OpenAI的GPT-4o生成合成臨床數據，以解決隱私法規和數據稀缺的問題。研究分為兩個階段：第一階段根據13個臨床參數創建了6,166個案例的結構化數據集，數據合理且準確；第二階段則利用真實的圍手術期數據集VitalDB生成數據，結果顯示92.31%的參數與VitalDB相似，且大多數參數間無顯著差異。研究顯示GPT-4o能有效生成反映實際臨床數據的合成數據，未來應進一步提高數據真實性並探索大型語言模型的潛力。 PubMed DOI

Clinical Text Generation: Are We There Yet?
臨床文本生成：我們到了嗎？ Annu Rev Biomed Data Sci 2025-03-18

生成式人工智慧，特別是大型語言模型，正逐漸在生物醫學領域中普及，應用於文本處理任務如分類和資訊擷取。文章強調這些模型的主要功能是生成非結構化文本，並回顧歷史及現有的文本生成方法，討論評估技術。臨床應用方面，這些模型能創建高品質的臨床筆記和合成文本，但也提到潛在風險，如過度自信和偏見可能造成的傷害。 PubMed DOI

Using Synthetic Health Care Data to Leverage Large Language Models for Named Entity Recognition: Development and Validation Study.
使用合成健康照護數據來利用大型語言模型進行命名實體識別：開發與驗證研究。 J Med Internet Res 2025-03-18

這項研究針對低資源語言，特別是愛沙尼亞語，開發命名實體識別（NER）模型，目的是從醫療記錄中提取重要的醫療實體。由於缺乏標註數據，作者提出三步驟方法：首先，利用本地訓練的GPT-2生成合成醫療數據；接著，使用GPT-3.5-Turbo和GPT-4對這些數據進行標註；最後，微調NER模型並測試真實醫療文本。研究結果顯示，藥物提取的F<sub>1</sub>分數為0.69，程序提取為0.38，顯示出在藥物識別上的有效性，並指出程序提取的挑戰。這方法為未來在其他語言的研究提供了新方向。 PubMed DOI

Robust privacy amidst innovation with large language models through a critical assessment of the risks.
在大型語言模型創新中的穩健隱私：對風險的批判性評估。 J Am Med Inform Assoc 2025-03-20

這項研究探討如何將電子健康紀錄（EHRs）與自然語言處理（NLP）及大型語言模型（LLMs）結合，以改善醫療數據管理和病人照護。研究使用MIMIC III數據集，採用GPT-3.5、GPT-4等模型生成符合HIPAA要求的合成病人紀錄。結果顯示，基於關鍵字的方法在隱私保護上風險較低，且保持良好性能，建議未來可考慮使用虛擬的PHI來提升實用性與隱私保護。 PubMed DOI

Application of Generative Artificial Intelligence for Physician and Patient Oncology Letters-AI-OncLetters.
應用生成式人工智慧於醫師與病患的腫瘤學通訊—AI-OncLetters JCO Clin Cancer Inform 2025-05-02

這項研究發現，ChatGPT在模擬腫瘤科病例下，能用結構化提示產生高品質的醫師和病人信件，內容正確、完整又相關，且沒有安全疑慮。病人信件也寫得清楚易懂，適合一般人閱讀。雖然偶爾有小錯誤，但多數人願意接受AI信件。建議未來可和真人信件進一步比較。 PubMed DOI

Synthetic data distillation enables the extraction of clinical information at scale.
合成數據蒸餾技術實現大規模臨床資訊的萃取 NPJ Digit Med 2025-05-10

這項研究用大型LLM產生合成資料，來訓練較小的開源模型，讓它們在臨床紀錄資訊擷取上表現接近大型模型。8B參數的模型幾乎和70B一樣好，且只針對難題微調也有效。這方法能降低運算需求、保護隱私，適合在本地硬體上應用。 PubMed DOI

Evaluation and Bias Analysis of Large Language Models in Generating Synthetic Electronic Health Records: Comparative Study.
大型語言模型在生成合成電子健康紀錄的評估與偏誤分析：比較性研究 J Med Internet Res 2025-05-12

這項研究評估7種大型語言模型產生的14萬筆合成電子健康紀錄，發現模型越大，資料越完整，但性別和種族偏見也越明顯。性別偏見多反映現實疾病分布，種族偏見則不一致，部分模型高估White或Black患者，低估Hispanic和Asian族群。研究強調AI健康資料需兼顧準確性與公平性，並呼籲建立更完善的偏見評估標準。 PubMed DOI

A framework to assess clinical safety and hallucination rates of LLMs for medical text summarisation.
用於醫學文本摘要之大型語言模型（LLMs）臨床安全性與幻覺率評估框架 NPJ Digit Med 2025-05-13

這項研究提出一套新框架，能提升大型語言模型（LLM）生成臨床紀錄的準確性與安全性。透過錯誤分類、反覆評估、臨床安全性檢查和CREOLA介面，分析近1.3萬句臨床標註句子後，發現幻覺率1.47%、遺漏率3.45%。經優化後，重大錯誤率甚至比人類醫師還低，顯示這方法有助於提升LLM臨床應用的安全性。 PubMed DOI

A review on generative AI models for synthetic medical text, time series, and longitudinal data.
生成式 AI 模型於合成醫療文本、時間序列與縱向資料之綜述 NPJ Digit Med 2025-05-15

這篇回顧分析52篇合成健康紀錄（SHRs）研究，涵蓋醫療文本、時間序列和縱向資料。多數研究聚焦於隱私保護，也有解決資料不平衡、稀缺和補值問題。結果顯示，縱向資料以對抗式網路最佳，時間序列適合機率模型，醫療文本則以大型語言模型表現最優。目前最大缺口是缺乏有效評估合成資料再識別風險的方法。 PubMed DOI

原始文章

站上相關主題文章列表