原始文章

呼吸系統疾病是全球健康的重要議題,常因症狀重疊而誤診。為了解決這個問題,我們開發了**LungDiag**,一個基於人工智慧的診斷系統,透過自然語言處理從電子健康紀錄中提取關鍵臨床特徵,以更準確地分類疾病。研究使用了31,267份EHRs進行訓練,並用1,142份進行驗證。**LungDiag**的診斷能力相當出色,主要診斷的F1分數達0.711,超越人類專家及ChatGPT 4.0。未來仍需進一步研究以確認其臨床有效性。 PubMed DOI


站上相關主題文章列表

研究比較了KARA-CXR和ChatGPT兩種人工智慧技術在閱讀胸部X光片時的表現,結果顯示KARA-CXR準確性較高,且在虛假發現、位置不準確和幻覺方面表現也更好。這研究強調了人工智慧和語言模型在醫學影像領域的潛力,KARA-CXR在胸部X光片診斷上有很大的發展空間。 PubMed DOI

研究評估了ChatGPT-4V在解讀COVID-19、NSCLC和對照組案例的胸部CT掃描的準確性。ChatGPT-4V整體準確率為56.76%,對不同情況的敏感性和特異性有所不同。模型在所有肺葉案例中表現最佳。研究強調了AI模型在放射學中的挑戰和改進領域,呼籲加強模型以提升醫療應用的可靠性。 PubMed DOI

傳統的預訓練和微調方法對於常見疾病有效,但對於罕見職業病如塵肺診斷困難。大型語言模型(LLMs)在多任務對話診斷中有潛力。新策略使用適配器層進行視覺-語言對齊,透過對話診斷,雖然挑戰性高,但可提高LLMs效果。移除文本分支、替換對話頭為分類頭,以增進LLMs效能。引入上下文多令牌引擎平衡圖像資訊和準確診斷,並使用信息發射器模塊單向信息流。實驗證實這些方法有效。 PubMed DOI

這項研究開發了一個基於人工智慧的異常檢測模型,幫助醫療人員識別新型疾病並防止疫情擴散。模型使用來自麻薩諸塞州一所醫院的120,714名住院病人數據,基於生成預訓練變壓器(GPT)架構,並透過經驗風險最小化進行訓練。它分析電子健康紀錄,檢測不尋常的病人特徵,並在COVID-19疫情初期成功預測住院情況,達到92.2%的準確率。該模型在異常檢測和死亡預測上表現優異,顯示出在現代醫療中的潛力。 PubMed DOI

這項研究探討大型語言模型(LLMs)在從非結構化放射報告中提取臨床數據的效果,專注於七種肺部疾病。研究分析了1,800份報告,並使用Google Gemini Pro 1.0、OpenAI的GPT-3.5和GPT-4進行數據提取。結果顯示,所有模型的準確率都很高,特別是GPT-4的表現最佳,敏感性和特異性均達到優秀水準。這些結果顯示,LLMs,尤其是GPT-4,可能成為醫生進行病歷審查的有效替代方案,提升非結構化放射數據的提取能力。 PubMed DOI

最近,自然語言處理(NLP)在醫療領域的進展顯著,特別是在數據分析和診斷方面。OpenAI的ChatGPT 4.0被評估在胸部影像診斷的表現,整體準確率達84.9%。它在術語和診斷徵象上表現優異,重症監護和正常解剖的準確率分別為90%和80%。在病理問題上,平均準確率為89.1%,但在某些疾病如肺癌的表現較差。總體來看,ChatGPT 4.0顯示出潛力,但仍需進一步研究以提升其臨床應用的可靠性。 PubMed DOI

癡呆症的診斷在全球醫療中面臨挑戰,主要因為其複雜性及電子健康紀錄的不一致性。傳統診斷方法可能會漏掉或錯誤識別病例,因此需要改進工具。本研究探討人工智慧(AI)及大型語言模型(LLMs)在提升癡呆症檢測的潛力。研究結果顯示,使用GPT-4的患者紀錄聚合方法達到最高準確率0.86,顯示大型語言模型能顯著改善癡呆症診斷的準確性,優於傳統方法。 PubMed DOI

這項研究探討了診斷結核性胸腔積液(TPE)的挑戰,並利用ChatGPT-4開發診斷模型,與傳統邏輯回歸及機器學習模型進行比較。研究收集了109名TPE患者和54名非TPE患者的臨床數據,選擇了73個相關特徵。結果顯示,LLM在敏感性、特異性及整體準確性上超越了邏輯回歸,並與機器學習模型相當。研究還開發了一個Python套件,提供快速診斷工具,顯示出LLM模型在臨床上的潛力,但仍需更大數據集進行驗證。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

這項研究探討了使用ChatGPT 4.0搭配「X-Ray Interpreter」來解讀急診胸部X光片。分析了1,400張來自NIH的影像,涵蓋七種病理類別。ChatGPT在識別正常X光片方面表現優異,敏感度達98.9%,特異度93.9%。對於肺炎和氣胸的診斷表現較好,但在肺不張和肺氣腫上則較差。總體來看,ChatGPT作為輔助診斷工具顯示潛力,但對於更細微的診斷仍需改進,未來可與專業影像識別模型整合以提升能力。 PubMed DOI