原始文章

研究發現,把肺部生物標記(FABP4 基因表現)和 GPT-4 AI 分析電子病歷結合,診斷重症成人下呼吸道感染的準確率最高可達 96%,比單獨使用或傳統診斷更準。這種結合方式有望大幅提升重症病人 LRTI 的診斷效果。 PubMed DOI


站上相關主題文章列表

這項研究探討大型語言模型(LLMs)在從非結構化放射報告中提取臨床數據的效果,專注於七種肺部疾病。研究分析了1,800份報告,並使用Google Gemini Pro 1.0、OpenAI的GPT-3.5和GPT-4進行數據提取。結果顯示,所有模型的準確率都很高,特別是GPT-4的表現最佳,敏感性和特異性均達到優秀水準。這些結果顯示,LLMs,尤其是GPT-4,可能成為醫生進行病歷審查的有效替代方案,提升非結構化放射數據的提取能力。 PubMed DOI

呼吸系統疾病是全球健康的重要議題,常因症狀重疊而誤診。為了解決這個問題,我們開發了**LungDiag**,一個基於人工智慧的診斷系統,透過自然語言處理從電子健康紀錄中提取關鍵臨床特徵,以更準確地分類疾病。研究使用了31,267份EHRs進行訓練,並用1,142份進行驗證。**LungDiag**的診斷能力相當出色,主要診斷的F1分數達0.711,超越人類專家及ChatGPT 4.0。未來仍需進一步研究以確認其臨床有效性。 PubMed DOI

這項研究探討了診斷結核性胸腔積液(TPE)的挑戰,並利用ChatGPT-4開發診斷模型,與傳統邏輯回歸及機器學習模型進行比較。研究收集了109名TPE患者和54名非TPE患者的臨床數據,選擇了73個相關特徵。結果顯示,LLM在敏感性、特異性及整體準確性上超越了邏輯回歸,並與機器學習模型相當。研究還開發了一個Python套件,提供快速診斷工具,顯示出LLM模型在臨床上的潛力,但仍需更大數據集進行驗證。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

小兒肺炎診斷困難,影響幼童生命。P2Med-MLLM是一款結合文字和醫學影像分析的AI模型,能協助醫師更快更準確診斷與治療。實測結果顯示,這個模型比現有方法更有效率,有助於提升醫療品質並拯救更多孩子的生命。 PubMed DOI

這篇研究提出COMPOSER-LLM,把大型語言模型和現有敗血症預測工具結合,能同時分析結構化數據和臨床紀錄文字。實測2,500名病人,結果顯示新系統比傳統模型更準確,敏感度高、誤報少。即使有誤判,很多病人其實也有感染,證明這方法在臨床上很有幫助。整合LLM能更有效利用電子病歷,提升敗血症早期預測。 PubMed DOI

一項涵蓋13家醫院的研究發現,GPT-4-Turbo這種大型語言模型在判斷病人是否有近期長照機構接觸史時,準確度跟人工差不多甚至更高,速度快25倍、成本省20倍,還能抓出人工審查的錯誤。這代表AI能有效從醫療紀錄中擷取重要資訊,幫助提升感染控制和醫院作業效率。 PubMed DOI

這項研究發現,DeepSeek-R1 AI 能有效協助加護病房住院醫師診斷複雜重症,讓診斷正確率從 27% 提升到 58%,AI 自己的正確率則是 60%。有 AI 幫忙時,住院醫師不只診斷更準確,速度也更快,鑑別診斷品質也提升。整體來說,這類 AI 未來很有機會成為加護病房醫師的重要幫手。 PubMed DOI

這項研究比較五款主流大型語言模型解讀胸部CT報告的能力,發現GPT-4表現最佳,尤其在選擇題上最準確。微調後的GPT-3.5-Turbo也有明顯進步。整體來說,選擇題比開放式問答更容易答對。不同疾病和器官系統的結果有差異。結果顯示,優化後的AI模型有助於提升胸部CT解讀,對外科手術規劃很有幫助。 PubMed DOI

這項研究提出結合特徵摘要、思路鏈推理和混合型RAG架構的新提示工程方法,能提升大型語言模型判讀胸部CT報告、診斷肺部疾病的準確度。用2,965份報告測試,結果比傳統深度學習和其他提示法更準,外部驗證也表現優異。此方法不僅提升可解釋性,也有助臨床更精確診斷。 PubMed DOI