原始文章

呼吸系統疾病是全球健康的重要議題,常因症狀重疊而誤診。為了解決這個問題,我們開發了**LungDiag**,一個基於人工智慧的診斷系統,透過自然語言處理從電子健康紀錄中提取關鍵臨床特徵,以更準確地分類疾病。研究使用了31,267份EHRs進行訓練,並用1,142份進行驗證。**LungDiag**的診斷能力相當出色,主要診斷的F1分數達0.711,超越人類專家及ChatGPT 4.0。未來仍需進一步研究以確認其臨床有效性。 PubMed DOI


站上相關主題文章列表

這項研究探討大型語言模型(LLMs)在從非結構化放射報告中提取臨床數據的效果,專注於七種肺部疾病。研究分析了1,800份報告,並使用Google Gemini Pro 1.0、OpenAI的GPT-3.5和GPT-4進行數據提取。結果顯示,所有模型的準確率都很高,特別是GPT-4的表現最佳,敏感性和特異性均達到優秀水準。這些結果顯示,LLMs,尤其是GPT-4,可能成為醫生進行病歷審查的有效替代方案,提升非結構化放射數據的提取能力。 PubMed DOI

癡呆症的診斷在全球醫療中面臨挑戰,主要因為其複雜性及電子健康紀錄的不一致性。傳統診斷方法可能會漏掉或錯誤識別病例,因此需要改進工具。本研究探討人工智慧(AI)及大型語言模型(LLMs)在提升癡呆症檢測的潛力。研究結果顯示,使用GPT-4的患者紀錄聚合方法達到最高準確率0.86,顯示大型語言模型能顯著改善癡呆症診斷的準確性,優於傳統方法。 PubMed DOI

這項研究探討了診斷結核性胸腔積液(TPE)的挑戰,並利用ChatGPT-4開發診斷模型,與傳統邏輯回歸及機器學習模型進行比較。研究收集了109名TPE患者和54名非TPE患者的臨床數據,選擇了73個相關特徵。結果顯示,LLM在敏感性、特異性及整體準確性上超越了邏輯回歸,並與機器學習模型相當。研究還開發了一個Python套件,提供快速診斷工具,顯示出LLM模型在臨床上的潛力,但仍需更大數據集進行驗證。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

這項研究探討了使用ChatGPT 4.0搭配「X-Ray Interpreter」來解讀急診胸部X光片。分析了1,400張來自NIH的影像,涵蓋七種病理類別。ChatGPT在識別正常X光片方面表現優異,敏感度達98.9%,特異度93.9%。對於肺炎和氣胸的診斷表現較好,但在肺不張和肺氣腫上則較差。總體來看,ChatGPT作為輔助診斷工具顯示潛力,但對於更細微的診斷仍需改進,未來可與專業影像識別模型整合以提升能力。 PubMed DOI

這項研究開發了一種利用大型語言模型(LLMs)從電子健康紀錄(EHR)中識別健康狀況的策略,解決了手動標記的繁瑣問題。研究將2015年的心臟登記隊列與阿爾伯塔省的EHR系統結合,分析臨床筆記以檢測急性心肌梗塞、糖尿病和高血壓。結果顯示,LLM方法在敏感度和陰性預測值上優於傳統ICD代碼,且檢測趨勢穩定。這種方法有潛力提升EHR在即時疾病監測中的應用效率。 PubMed DOI

肺栓塞(PE)是一種危險的病症,需迅速診斷以降低死亡率。手動從放射科報告中提取PE診斷非常耗時,因此本研究探討使用GPT-4o模型自動化提取。研究開發了兩種方法:微調的Clinical Longformer和基於GPT-4o的提取器。結果顯示,GPT-4o在敏感性和F1分數上均優於Clinical Longformer,並在實際應用中保持高準確度。這顯示GPT-4o能有效簡化臨床流程,提升PE診斷的效率,改善病患結果。 PubMed DOI

研究發現,把肺部生物標記(FABP4 基因表現)和 GPT-4 AI 分析電子病歷結合,診斷重症成人下呼吸道感染的準確率最高可達 96%,比單獨使用或傳統診斷更準。這種結合方式有望大幅提升重症病人 LRTI 的診斷效果。 PubMed DOI

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力,發現GPT-4表現最佳,尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說,選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示,優化後的AI模型有助於提升胸部CT解讀,對外科手術規劃很有幫助。 PubMed DOI

這項研究提出結合特徵摘要、思路鏈推理和混合型RAG架構的新提示工程方法,能提升大型語言模型判讀胸部CT報告、診斷肺部疾病的準確度。用2,965份報告測試,結果比傳統深度學習和其他提示法更準,外部驗證也表現優異。此方法不僅提升可解釋性,也有助臨床更精確診斷。 PubMed DOI