Extraction of clinical data on major pulmonary diseases from unstructured radiologic reports using a large language model.
使用大型語言模型從非結構化放射學報告中提取主要肺部疾病的臨床數據。 PLoS One 2024-11-25

這項研究探討大型語言模型（LLMs）在從非結構化放射報告中提取臨床數據的效果，專注於七種肺部疾病。研究分析了1,800份報告，並使用Google Gemini Pro 1.0、OpenAI的GPT-3.5和GPT-4進行數據提取。結果顯示，所有模型的準確率都很高，特別是GPT-4的表現最佳，敏感性和特異性均達到優秀水準。這些結果顯示，LLMs，尤其是GPT-4，可能成為醫生進行病歷審查的有效替代方案，提升非結構化放射數據的提取能力。 PubMed DOI

Developing Topics.
發展主題。 Alzheimers Dement 2025-01-09

癡呆症的診斷在全球醫療中面臨挑戰，主要因為其複雜性及電子健康紀錄的不一致性。傳統診斷方法可能會漏掉或錯誤識別病例，因此需要改進工具。本研究探討人工智慧（AI）及大型語言模型（LLMs）在提升癡呆症檢測的潛力。研究結果顯示，使用GPT-4的患者紀錄聚合方法達到最高準確率0.86，顯示大型語言模型能顯著改善癡呆症診斷的準確性，優於傳統方法。 PubMed DOI

The large language model diagnoses tuberculous pleural effusion in pleural effusion patients through clinical feature landscapes.
大型語言模型透過臨床特徵景觀診斷胸腔積液患者的結核性胸腔積液。 Respir Res 2025-02-12

這項研究探討了診斷結核性胸腔積液（TPE）的挑戰，並利用ChatGPT-4開發診斷模型，與傳統邏輯回歸及機器學習模型進行比較。研究收集了109名TPE患者和54名非TPE患者的臨床數據，選擇了73個相關特徵。結果顯示，LLM在敏感性、特異性及整體準確性上超越了邏輯回歸，並與機器學習模型相當。研究還開發了一個Python套件，提供快速診斷工具，顯示出LLM模型在臨床上的潛力，但仍需更大數據集進行驗證。 PubMed DOI

Language Artificial Intelligence Models as Pioneers in Diagnostic Medicine? A Retrospective Analysis on Real-Time Patients.
語言人工智慧模型作為診斷醫學的先驅？對即時患者的回顧性分析。 J Clin Med 2025-02-26

本研究探討AI模型（如GPT-3.5和GPT-4）在急診科生成病症鑑別診斷的表現，並與急診科醫師的準確性進行比較。結果顯示，ChatGPT-4的準確率為85.5%，略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面，ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值，建議未來進一步探索AI在醫療中的應用。 PubMed DOI

Evaluating a large language model's accuracy in chest X-ray interpretation for acute thoracic conditions.
評估大型語言模型在急性胸部疾病胸部 X 光解讀中的準確性。 Am J Emerg Med 2025-04-02

這項研究探討了使用ChatGPT 4.0搭配「X-Ray Interpreter」來解讀急診胸部X光片。分析了1,400張來自NIH的影像，涵蓋七種病理類別。ChatGPT在識別正常X光片方面表現優異，敏感度達98.9%，特異度93.9%。對於肺炎和氣胸的診斷表現較好，但在肺不張和肺氣腫上則較差。總體來看，ChatGPT作為輔助診斷工具顯示潛力，但對於更細微的診斷仍需改進，未來可與專業影像識別模型整合以提升能力。 PubMed DOI

Integrating large language models with human expertise for disease detection in electronic health records.
將大型語言模型與人類專業知識整合以進行電子健康紀錄中的疾病檢測。 Comput Biol Med 2025-04-08

這項研究開發了一種利用大型語言模型（LLMs）從電子健康紀錄（EHR）中識別健康狀況的策略，解決了手動標記的繁瑣問題。研究將2015年的心臟登記隊列與阿爾伯塔省的EHR系統結合，分析臨床筆記以檢測急性心肌梗塞、糖尿病和高血壓。結果顯示，LLM方法在敏感度和陰性預測值上優於傳統ICD代碼，且檢測趨勢穩定。這種方法有潛力提升EHR在即時疾病監測中的應用效率。 PubMed DOI

Extracting Pulmonary Embolism Diagnoses From Radiology Impressions Using GPT-4o: Large Language Model Evaluation Study.
使用 GPT-4o 從放射學印象中提取肺栓塞診斷：大型語言模型評估研究。 JMIR Med Inform 2025-04-09

肺栓塞（PE）是一種危險的病症，需迅速診斷以降低死亡率。手動從放射科報告中提取PE診斷非常耗時，因此本研究探討使用GPT-4o模型自動化提取。研究開發了兩種方法：微調的Clinical Longformer和基於GPT-4o的提取器。結果顯示，GPT-4o在敏感性和F1分數上均優於Clinical Longformer，並在實際應用中保持高準確度。這顯示GPT-4o能有效簡化臨床流程，提升PE診斷的效率，改善病患結果。 PubMed DOI

Integrating a host transcriptomic biomarker with a large language model for diagnosis of lower respiratory tract infection.
結合宿主轉錄體生物標記與大型語言模型於下呼吸道感染的診斷 medRxiv 2025-04-16

研究發現，把肺部生物標記（FABP4 基因表現）和 GPT-4 AI 分析電子病歷結合，診斷重症成人下呼吸道感染的準確率最高可達 96%，比單獨使用或傳統診斷更準。這種結合方式有望大幅提升重症病人 LRTI 的診斷效果。 PubMed DOI

Performance analysis of large language models in multi-disease detection from chest computed tomography reports: a comparative study: Experimental Research.
大型語言模型於胸部電腦斷層報告多重疾病偵測之表現分析：比較性研究 Int J Surg 2025-06-11

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力，發現GPT-4表現最佳，尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說，選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示，優化後的AI模型有助於提升胸部CT解讀，對外科手術規劃很有幫助。 PubMed DOI

Enhancing Pulmonary Disease Prediction Using Large Language Models With Feature Summarization and Hybrid Retrieval-Augmented Generation: Multicenter Methodological Study Based on Radiology Report.
利用特徵摘要與混合檢索增強生成（Hybrid Retrieval-Augmented Generation），結合大型語言模型提升肺部疾病預測：基於放射報告的多中心方法學研究 J Med Internet Res 2025-06-11

這項研究提出結合特徵摘要、思路鏈推理和混合型RAG架構的新提示工程方法，能提升大型語言模型判讀胸部CT報告、診斷肺部疾病的準確度。用2,965份報告測試，結果比傳統深度學習和其他提示法更準，外部驗證也表現優異。此方法不僅提升可解釋性，也有助臨床更精確診斷。 PubMed DOI

原始文章

站上相關主題文章列表