Extraction of clinical data on major pulmonary diseases from unstructured radiologic reports using a large language model.
使用大型語言模型從非結構化放射學報告中提取主要肺部疾病的臨床數據。 PLoS One 2024-11-25

這項研究探討大型語言模型（LLMs）在從非結構化放射報告中提取臨床數據的效果，專注於七種肺部疾病。研究分析了1,800份報告，並使用Google Gemini Pro 1.0、OpenAI的GPT-3.5和GPT-4進行數據提取。結果顯示，所有模型的準確率都很高，特別是GPT-4的表現最佳，敏感性和特異性均達到優秀水準。這些結果顯示，LLMs，尤其是GPT-4，可能成為醫生進行病歷審查的有效替代方案，提升非結構化放射數據的提取能力。 PubMed DOI

<i>LungDiag</i>: Empowering artificial intelligence for respiratory diseases diagnosis based on electronic health records, a multicenter study.
<i>LungDiag</i>: 基於電子健康紀錄的呼吸疾病診斷之人工智慧賦能，多中心研究。 MedComm (2020) 2025-01-13

呼吸系統疾病是全球健康的重要議題，常因症狀重疊而誤診。為了解決這個問題，我們開發了**LungDiag**，一個基於人工智慧的診斷系統，透過自然語言處理從電子健康紀錄中提取關鍵臨床特徵，以更準確地分類疾病。研究使用了31,267份EHRs進行訓練，並用1,142份進行驗證。**LungDiag**的診斷能力相當出色，主要診斷的F1分數達0.711，超越人類專家及ChatGPT 4.0。未來仍需進一步研究以確認其臨床有效性。 PubMed DOI

The large language model diagnoses tuberculous pleural effusion in pleural effusion patients through clinical feature landscapes.
大型語言模型透過臨床特徵景觀診斷胸腔積液患者的結核性胸腔積液。 Respir Res 2025-02-12

這項研究探討了診斷結核性胸腔積液（TPE）的挑戰，並利用ChatGPT-4開發診斷模型，與傳統邏輯回歸及機器學習模型進行比較。研究收集了109名TPE患者和54名非TPE患者的臨床數據，選擇了73個相關特徵。結果顯示，LLM在敏感性、特異性及整體準確性上超越了邏輯回歸，並與機器學習模型相當。研究還開發了一個Python套件，提供快速診斷工具，顯示出LLM模型在臨床上的潛力，但仍需更大數據集進行驗證。 PubMed DOI

Language Artificial Intelligence Models as Pioneers in Diagnostic Medicine? A Retrospective Analysis on Real-Time Patients.
語言人工智慧模型作為診斷醫學的先驅？對即時患者的回顧性分析。 J Clin Med 2025-02-26

本研究探討AI模型（如GPT-3.5和GPT-4）在急診科生成病症鑑別診斷的表現，並與急診科醫師的準確性進行比較。結果顯示，ChatGPT-4的準確率為85.5%，略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面，ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值，建議未來進一步探索AI在醫療中的應用。 PubMed DOI

A Medical Multimodal Large Language Model for Pediatric Pneumonia.
用於兒童肺炎的醫學多模態大型語言模型 IEEE J Biomed Health Inform 2025-05-12

小兒肺炎診斷困難，影響幼童生命。P2Med-MLLM是一款結合文字和醫學影像分析的AI模型，能協助醫師更快更準確診斷與治療。實測結果顯示，這個模型比現有方法更有效率，有助於提升醫療品質並拯救更多孩子的生命。 PubMed DOI

Development and prospective implementation of a large language model based system for early sepsis prediction.
基於大型語言模型系統於早期敗血症預測的開發與前瞻性應用 NPJ Digit Med 2025-05-16

這篇研究提出COMPOSER-LLM，把大型語言模型和現有敗血症預測工具結合，能同時分析結構化數據和臨床紀錄文字。實測2,500名病人，結果顯示新系統比傳統模型更準確，敏感度高、誤報少。即使有誤判，很多病人其實也有感染，證明這方法在臨床上很有幫助。整合LLM能更有效利用電子病歷，提升敗血症早期預測。 PubMed DOI

Identification of Long-Term Care Facility Residence From Admission Notes Using Large Language Models.
利用大型語言模型從入院紀錄辨識長期照護機構居住狀態 JAMA Netw Open 2025-05-22

一項涵蓋13家醫院的研究發現，GPT-4-Turbo這種大型語言模型在判斷病人是否有近期長照機構接觸史時，準確度跟人工差不多甚至更高，速度快25倍、成本省20倍，還能抓出人工審查的錯誤。這代表AI能有效從醫療紀錄中擷取重要資訊，幫助提升感染控制和醫院作業效率。 PubMed DOI

A large language model improves clinicians' diagnostic performance in complex critical illness cases.
大型語言模型提升臨床醫師在複雜重症病例中的診斷表現 Crit Care 2025-06-06

這項研究發現，DeepSeek-R1 AI 能有效協助加護病房住院醫師診斷複雜重症，讓診斷正確率從 27% 提升到 58%，AI 自己的正確率則是 60%。有 AI 幫忙時，住院醫師不只診斷更準確，速度也更快，鑑別診斷品質也提升。整體來說，這類 AI 未來很有機會成為加護病房醫師的重要幫手。 PubMed DOI

Performance analysis of large language models in multi-disease detection from chest computed tomography reports: a comparative study: Experimental Research.
大型語言模型於胸部電腦斷層報告多重疾病偵測之表現分析：比較性研究 Int J Surg 2025-06-11

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力，發現GPT-4表現最佳，尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說，選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示，優化後的AI模型有助於提升胸部CT解讀，對外科手術規劃很有幫助。 PubMed DOI

Enhancing Pulmonary Disease Prediction Using Large Language Models With Feature Summarization and Hybrid Retrieval-Augmented Generation: Multicenter Methodological Study Based on Radiology Report.
利用特徵摘要與混合檢索增強生成（Hybrid Retrieval-Augmented Generation），結合大型語言模型提升肺部疾病預測：基於放射報告的多中心方法學研究 J Med Internet Res 2025-06-11

這項研究提出結合特徵摘要、思路鏈推理和混合型RAG架構的新提示工程方法，能提升大型語言模型判讀胸部CT報告、診斷肺部疾病的準確度。用2,965份報告測試，結果比傳統深度學習和其他提示法更準，外部驗證也表現優異。此方法不僅提升可解釋性，也有助臨床更精確診斷。 PubMed DOI

原始文章

站上相關主題文章列表