原始文章

這項研究探討了緊急情境中的分診決策,對比醫療專業人員與人工智慧(AI)模型的表現。研究發現,醫療人員的準確率(30.7%)高於AI模型(25.5%),顯示人類專業知識在分診中仍然更可靠。研究涉及50個虛擬病人情境,參與者使用土耳其衛生部的顏色編碼系統進行分類。雖然AI能快速分析數據,但在此情境下表現不如人類。作者建議結合AI與人類專業知識,以提升分診系統的效率。 PubMed DOI


站上相關主題文章列表

這項研究評估了AI語言模型GPT-3在診斷和分診的表現,並與一般人和醫生進行比較,使用了48個醫療案例。結果顯示,GPT-3在88%的案例中準確診斷,優於一般人(54%),但低於醫生(96%)。在分診準確性方面,GPT-3達70%,接近一般人(74%),但仍低於醫生(91%)。雖然GPT-3對預測的信心合理,但在急迫案例中準確性下降,偶爾會將緊急案例降為次要。總體而言,GPT-3的診斷表現不錯,但分診效果仍不如醫生。 PubMed DOI

這項研究比較了三層級的分診協議,包括分診護士、急診醫師和人工智慧模型(ChatGPT、Gemini 和 Pi),在2024年4月1日至4月7日於一所三級醫療機構的急診部門進行,分析了500名病人的數據。結果顯示,只有23.8%的病人獲得一致分類,分診護士對6.4%的病人過度分診,且人工智慧模型的分診不足率偏高,特別是ChatGPT在黃碼和紅碼病人中分診不足達26.5%和42.6%。結論指出,急診環境中不應僅依賴人工智慧進行分診。 PubMed DOI

這項研究評估了ChatGPT-4o在急性心臟病案例中的表現,並與心臟科醫生和急診醫生進行比較。結果顯示,ChatGPT-4o和心臟科醫生的準確性均達100%,而急診醫生較低。ChatGPT-4o反應最快,且在準確性和完整性上得分最高。研究顯示,ChatGPT-4o的表現優於人類醫生,顯示其在臨床決策支持上的潛力,但人類監督仍然對安全整合AI進醫療至關重要。 PubMed DOI

這項可行性研究探討了人工智慧(AI),特別是Chat-GPT在急性婦產科緊急情況中的應用。研究中使用了十個虛構案例,Chat-GPT提供的分診和管理建議經過人類專家的審查。結果顯示,Chat-GPT的分診結果與人類評估者相近,管理建議也獲得高評價,顯示其具備提供結構化建議的能力。不過,評估者指出在緊急程度的感知上有些微差異,強調人類監督的重要性。總體而言,研究建議將Chat-GPT與人類專業知識結合,以確保最佳病人護理。 PubMed DOI

這項研究探討了大型語言模型ChatGPT在腎臟科病例分診的有效性,特別是在因人口老化導致腎臟問題增加的情況下。兩位腎臟科醫生設計了100個病人情境,結果顯示ChatGPT在判斷腎臟科需求的準確率高達99-100%,選擇正確子專科的準確率為96-99%,兩輪評估的協議率為97%。雖然結果顯示AI能提升醫療分診的效率與準確性,但仍需改進在複雜病情的多學科護理整合方面。整體而言,研究強調了AI在改善臨床決策及發展量身訂做的分診系統的潛力。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

這項研究評估了ChatGPT 4.0在急診部門進行病人分診的效果,並與人類分診人員進行比較。分析了2,658名病人的數據,結果顯示AI與人類的分診協議程度較低(kappa = 0.125)。在人類分診預測30天死亡率和生命救援需求方面,表現明顯優於AI(ROC分別為0.88對0.70及0.98對0.87)。這顯示雖然AI有潛力,但在急診分診中仍不如人類可靠,特別是對高風險病人的評估。 PubMed DOI

這項多中心研究發現,ChatGPT-4o在急診分級的表現整體優於人類分級人員,和急診專科醫師的判斷高度一致(kappa 0.833,F1 0.897)。不過,在醫學中心處理較複雜的急診個案時,ChatGPT的準確度會下降。總結來說,ChatGPT在大多數情境下都很準確,但遇到複雜病例還是有進步空間。 PubMed DOI

這項研究用ChatGPT打造的聊天機器人,測試100個假設眼科急診案例,分級結果和三位資深眼科醫師高度一致(Cohen’s kappa約0.74–0.75),整體一致性也很高(Fleiss’ kappa = 0.79),和醫師表現沒顯著差異。顯示AI聊天機器人在眼科急診分級上,準確度可媲美專業醫師,有望成為急診分級的輔助工具。 PubMed DOI

這項研究用模擬病人測試ChatGPT(GPT-4o和GPT-4-Turbo)在急診分級和門診指引的表現。經過優化後,GPT-4-Turbo用MEWS分級達到100%準確率,優於GPT-4o(96.2%);GPT-4o在門診科別選擇也有92.6%高準確率,且情感回應更好。結果顯示,經設計的ChatGPT能有效協助急診分級與指引,但還需更多臨床驗證。 PubMed DOI