ChatGPT-Assisted Machine Learning for Chronic Disease Classification and Prediction: A Developmental and Validation Study.
ChatGPT 輔助的機器學習在慢性疾病分類與預測中的應用：一項發展與驗證研究。 Cureus 2025-01-17

這項前瞻性觀察研究針對270名病人進行，最終260名完成研究。研究涵蓋慢性腎病、慢性肝病、結核病、癡呆症和心臟病等慢性疾病，並開發了三個機器學習模型。結果顯示，隨機森林模型在預測CKD和心臟病方面表現最佳，準確率分別為85.3%和88.2%。此外，邏輯回歸在預測TB和癡呆症上也有不錯的表現。研究強調機器學習在慢性疾病預測中的潛力，並建議未來進行多中心研究以驗證結果。 PubMed DOI

A phenotype-based AI pipeline outperforms human experts in differentially diagnosing rare diseases using EHRs.
基於表現型的人工智慧管道在使用電子健康紀錄進行罕見疾病的鑑別診斷中超越了人類專家。 NPJ Digit Med 2025-01-28

PhenoBrain是一個創新的AI系統，專門用來解決罕見疾病的診斷問題，影響全球約3.5億人。它利用基於BERT的自然語言處理技術，從電子健康紀錄中提取重要資訊，並透過五個新診斷模型進行鑑別。經過在2,271個案例和431種罕見疾病的測試，PhenoBrain的表現超越了多種預測方法，顯示出在臨床環境中提升診斷準確性的潛力。 PubMed DOI

Leveraging large language models to mimic domain expert labeling in unstructured text-based electronic healthcare records in non-english languages.
利用大型語言模型模擬非英語語言中無結構文本電子健康紀錄的領域專家標註。 BMC Med Inform Decis Mak 2025-04-01

大數據與人工智慧在醫療保健中結合，特別是透過電子健康紀錄（EHR）的分析，能顯著提升診斷準確性。然而，處理大量非結構化數據是一大挑戰。本研究探討大型語言模型（LLMs）在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例，經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率，顯著優於預訓練模型的78.54%。結果顯示，微調的LLMs能高效分類非結構化EHR數據，提升醫療數據處理的效率與可靠性。 PubMed DOI

Comparative analysis of large language models on rare disease identification.
大型語言模型在罕見疾病識別上的比較分析。 Orphanet J Rare Dis 2025-04-01

這項研究顯示大型語言模型（LLMs）在診斷罕見疾病方面的潛力，因為這些疾病因發病率低且表現多樣而難以識別。研究分析了152個來自中國醫學案例資料庫的案例，並比較了四個LLMs（ChatGPT-4o、Claude 3.5 Sonnet、Gemini Advanced和Llama 3.1 405B）與人類醫師的診斷準確性。結果顯示，LLMs的表現超越人類醫師，Claude 3.5 Sonnet的準確率達78.9%，而人類醫師僅26.3%。這顯示LLMs在臨床上可能成為有價值的工具，但在實際應用前仍需進一步驗證及考量倫理與隱私問題。 PubMed DOI

Integrating large language models with human expertise for disease detection in electronic health records.
將大型語言模型與人類專業知識整合以進行電子健康紀錄中的疾病檢測。 Comput Biol Med 2025-04-08

這項研究開發了一種利用大型語言模型（LLMs）從電子健康紀錄（EHR）中識別健康狀況的策略，解決了手動標記的繁瑣問題。研究將2015年的心臟登記隊列與阿爾伯塔省的EHR系統結合，分析臨床筆記以檢測急性心肌梗塞、糖尿病和高血壓。結果顯示，LLM方法在敏感度和陰性預測值上優於傳統ICD代碼，且檢測趨勢穩定。這種方法有潛力提升EHR在即時疾病監測中的應用效率。 PubMed DOI

First steps toward building natural history of diseases computationally: Lessons learned from the Noonan syndrome use case.
以計算方式建立疾病自然史的初步探索：Noonan syndrome 案例的經驗教訓 Am J Hum Genet 2025-04-17

這項研究利用大型語言模型分析電子健康紀錄，追蹤Noonan症候群等罕見疾病患者的症狀變化。目的是加深對疾病的了解、驗證現有知識，並協助提升罕見疾病患者的照護品質與協調。 PubMed DOI

Evaluating LLMs' Potential to Identify Rare Patient Identifiers in Patient Health Records.
評估大型語言模型（LLMs）在辨識病歷中罕見病人識別資訊的潛力 Stud Health Technol Inform 2025-05-17

這篇研究發現，大型語言模型（LLMs）雖然有潛力協助找出醫療紀錄中容易被忽略的間接病人識別資訊，但目前標記出來的很多其實是誤判。要真正把LLMs用在去識別化流程，還需要更多研究，才能確保病人隱私，同時又能安全分享醫療資料。 PubMed DOI

RDguru: An Intelligent Agent for Rare Diseases.
RDguru：罕見疾病的智慧型代理人 AMIA Annu Symp Proc 2025-05-26

這項研究推出 RDguru 智慧診斷系統，專為罕見疾病設計，結合 GPT-4、醫學知識和診斷工具。實測 238 個案例，RDguru 前 10 答案有 69.1% 命中正確診斷，前 5 有 63.6%，第一個建議正確率為 41.9%，能有效協助臨床決策。 PubMed

Enhancing Disease Detection in Radiology Reports Through Fine-tuning Lightweight LLM on Weak Labels.
透過在弱標註上微調輕量級LLM提升放射科報告的疾病偵測能力 AMIA Jt Summits Transl Sci Proc 2025-06-12

這篇研究發現，就算只有少量高品質標註，只要用像 GPT-4o 這種高品質合成標註來微調 Llama 3.1-8B 這類輕量級語言模型，醫療任務表現也能大幅提升（micro F1 可達 0.91）。即使合成標註品質較差，微調後的模型表現還是能超越原本的雜訊標註，顯示模型很有韌性，合成資料在醫療 LLM 微調上很有潛力。 PubMed

Using large language models to extract information from pediatric clinical reports.
利用大型語言模型從兒科臨床報告中擷取資訊 PLOS Digit Health 2025-07-23

大部分醫療紀錄都是非結構化，讓資料分析很困難。這項研究測試九種大型語言模型，能自動從兒科臨床報告擷取結構化資料。不論是商業還是開源模型，表現都很優秀，最好的模型辨識重要病患資訊的準確率超過九成。LLMs為醫療資料擷取提供靈活又準確的替代方案，有機會取代人工處理。 PubMed DOI

原始文章

站上相關主題文章列表