原始文章

這項研究開發了一個結合可解釋式AI的行動診斷平台,利用隨機森林判斷發燒疾病,並用LIME和GPT-3.5產生淺顯說明。系統對瘧疾診斷效果佳,泌尿道和呼吸道感染表現普通,傷寒和HIV/AIDS則較差。整合LIME和GPT-3.5後,能清楚標示關鍵症狀,提升透明度和信任度,但部分疾病診斷仍需加強。 PubMed DOI


站上相關主題文章列表

這項研究評估了AI語言模型GPT-3在診斷和分診的表現,並與一般人和醫生進行比較,使用了48個醫療案例。結果顯示,GPT-3在88%的案例中準確診斷,優於一般人(54%),但低於醫生(96%)。在分診準確性方面,GPT-3達70%,接近一般人(74%),但仍低於醫生(91%)。雖然GPT-3對預測的信心合理,但在急迫案例中準確性下降,偶爾會將緊急案例降為次要。總體而言,GPT-3的診斷表現不錯,但分診效果仍不如醫生。 PubMed DOI

這項研究探討熱帶地區診斷瘧疾和傷寒的挑戰,因為傳統方法在症狀重疊和藥物抗性上遇到困難。強調準確診斷的重要性以降低死亡率。雖然機器學習模型能提供準確預測,但缺乏透明度,讓醫療人員難以理解決策過程。研究採用可解釋的人工智慧技術,特別是LIME和大型語言模型(如GPT),來提升診斷的透明度。結果顯示隨機森林模型表現最佳,並提出整合這些技術的行動應用程式,雖然系統性能受限於數據質量和計算需求,但未來有潛力應用於其他醫療條件。 PubMed DOI

這項研究評估了四個AI模型(ChatGPT 3.5、Google Bard、HuggingChat和Claude 2)生成的醫療解釋對病人理解的幫助。結果顯示,Claude 2的可讀性和可理解性最佳,但可行性較低;ChatGPT表現相似。Google Bard和HuggingChat的得分則較差。整體來看,Claude 2和ChatGPT的解釋較為清晰易懂,但研究強調仍需進一步探討這些AI解釋在實際醫療環境中的應用,並指出PEMAT評估的主觀性和AI工具的快速變化是限制因素。 PubMed DOI

這項研究評估了ChatGPT-4o在診斷從流行區域回來的旅客發燒疾病的表現。研究分析了2009至2024年間114名住院發燒旅客的醫療紀錄,並將臨床情境提供給ChatGPT-4o。結果顯示,當要求提供最可能的診斷時,準確率為68%;前三名診斷的準確率為78%;所有可能診斷的準確率為83%。特別是在瘧疾方面,該模型的敏感性達100%,特異性94%。整體而言,ChatGPT-4o在評估回國旅客的發燒疾病上表現良好,未來可望進一步提升臨床決策的實用性。 PubMed DOI

生成式人工智慧(GAI)在醫療領域有顯著進展,但對於罕見疾病如原發性免疫疾病(PI)的輔助效果仍待探討。本研究評估了六種大型語言模型(LLMs)在提供PI臨床指導的表現。結果顯示,GPT-4o、Llama-3.1-70B-Instruct和Mistral-Large-Instruct-2407的診斷準確率超過88%,其中GPT-4o以96.2%領先。其他模型表現較差,準確率約60%或更低。雖然LLMs在PI診斷上顯示潛力,但仍需改進以提升臨床實用性。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

這項研究探討了一個微調過的GPT-3模型在農村醫療環境中對兒科病例診斷的有效性,因為這些地區專家資源有限。研究分析了路易斯安那州中部的500個兒科就診案例,發現模型準確率達87.3%,敏感度和特異度分別為85%和90%,與兒科醫生的91.3%相當。模型在不同年齡組和常見病症中表現穩定,但對罕見診斷的準確率稍低。總體來說,這個微調的GPT-3模型可作為農村兒科護理的可靠診斷工具,但仍需在不同人群中進一步驗證。 PubMed DOI

研究發現,把肺部生物標記(FABP4 基因表現)和 GPT-4 AI 分析電子病歷結合,診斷重症成人下呼吸道感染的準確率最高可達 96%,比單獨使用或傳統診斷更準。這種結合方式有望大幅提升重症病人 LRTI 的診斷效果。 PubMed DOI

這項研究推出 LLMonFHIR 行動 App,運用大型語言模型,幫助慢性心血管病人用多種語言、不同難度,甚至語音方式,查詢自己的電子健康紀錄。初步測試顯示,醫師認為 App 回覆正確、好懂又實用。雖然在健康摘要和檢驗數據查詢上還有改進空間,但 LLMonFHIR 有助於解決語言和健康素養障礙,讓病人更容易掌握自己的健康資訊。 PubMed DOI

這項研究比較了四種AI語言模型在風濕病診斷上的表現,發現ChatGPT-4和Claude AI的準確率最高,超過85%,尤其在感染性疾病診斷上表現突出。不過,所有AI在腫瘤相關疾病的診斷上都比較弱。整體來說,先進AI有助於提升非洲地區風濕病診斷,但對某些疾病還有改進空間。 PubMed DOI