原始文章

這項研究用AI自然語言處理技術,分析急診室醫護和病患的對話逐字稿,自動判斷病患緊急程度。研究用1,028份真實對話,透過機器學習和神經網路模型,AUROC分數約0.76,準確度不錯。這方法有助於優先處理急重症、縮短等候時間,提升急診效率,未來結合更強語言模型還有進步空間。 PubMed DOI


站上相關主題文章列表

這項研究比較了三層級的分診協議,包括分診護士、急診醫師和人工智慧模型(ChatGPT、Gemini 和 Pi),在2024年4月1日至4月7日於一所三級醫療機構的急診部門進行,分析了500名病人的數據。結果顯示,只有23.8%的病人獲得一致分類,分診護士對6.4%的病人過度分診,且人工智慧模型的分診不足率偏高,特別是ChatGPT在黃碼和紅碼病人中分診不足達26.5%和42.6%。結論指出,急診環境中不應僅依賴人工智慧進行分診。 PubMed DOI

這項研究探討了緊急情境中的分診決策,對比醫療專業人員與人工智慧(AI)模型的表現。研究發現,醫療人員的準確率(30.7%)高於AI模型(25.5%),顯示人類專業知識在分診中仍然更可靠。研究涉及50個虛擬病人情境,參與者使用土耳其衛生部的顏色編碼系統進行分類。雖然AI能快速分析數據,但在此情境下表現不如人類。作者建議結合AI與人類專業知識,以提升分診系統的效率。 PubMed DOI

在資源有限的國家,神經學緊急情況面臨挑戰,而人工智慧(AI)健康聊天機器人可能是解決方案。本研究評估了一個AI虛擬助手(VA)在神經疾病分診的安全性與有效性。 研究分為兩階段:首先,九位神經科醫生評估了十名患者的臨床紀錄,發現VA的診斷與專家一致性高達98.5%。其次,VA的準確性在患者互動中也獲得醫生的全力支持,平均互動時間為5.5分鐘。 VA在診斷和安全性上表現優於ChatGPT 3.5和4,57.8%的醫生評價其為「優秀」。這些結果顯示VA在緊急神經分診中的潛力,未來將進行更大規模的試驗。 PubMed DOI

本研究探討AI模型(如GPT-3.5和GPT-4)在急診科生成病症鑑別診斷的表現,並與急診科醫師的準確性進行比較。結果顯示,ChatGPT-4的準確率為85.5%,略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面,ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值,建議未來進一步探索AI在醫療中的應用。 PubMed DOI

這項研究評估了ChatGPT 4.0在急診部門進行病人分診的效果,並與人類分診人員進行比較。分析了2,658名病人的數據,結果顯示AI與人類的分診協議程度較低(kappa = 0.125)。在人類分診預測30天死亡率和生命救援需求方面,表現明顯優於AI(ROC分別為0.88對0.70及0.98對0.87)。這顯示雖然AI有潛力,但在急診分診中仍不如人類可靠,特別是對高風險病人的評估。 PubMed DOI

這項多中心研究發現,ChatGPT-4o在急診分級的表現整體優於人類分級人員,和急診專科醫師的判斷高度一致(kappa 0.833,F1 0.897)。不過,在醫學中心處理較複雜的急診個案時,ChatGPT的準確度會下降。總結來說,ChatGPT在大多數情境下都很準確,但遇到複雜病例還是有進步空間。 PubMed DOI

這項研究用ChatGPT/GPT-4和翻譯軟體,快速製作三種常見急診主訴的AI出院衛教手冊。八位急診醫師給予高分評價,但部分內容還需修正。手冊可讀性約在高中到大學程度,可能有高估。AI能有效產出衛教資料,但仍需人工審核,未來還要研究對病人的實際幫助及擴展應用。 PubMed DOI

這項研究測試AI分診系統,能用語音辨識和大型語言模型自動判斷急診嚴重程度和主訴代碼,即使遇到瑞士德語方言也行。雖然語音辨識錯誤率較高,但AI分類準確率仍達九成以上,有助提升分診一致性、減輕醫護壓力。未來需加強多語言處理和資料安全。 PubMed DOI

這項研究用模擬病人測試ChatGPT(GPT-4o和GPT-4-Turbo)在急診分級和門診指引的表現。經過優化後,GPT-4-Turbo用MEWS分級達到100%準確率,優於GPT-4o(96.2%);GPT-4o在門診科別選擇也有92.6%高準確率,且情感回應更好。結果顯示,經設計的ChatGPT能有效協助急診分級與指引,但還需更多臨床驗證。 PubMed DOI

這項研究用多個大型語言模型(像是GPT-4、Claude 3.5等)來自動化產生EMS對話的電子病歷,結果比單一模型更準確,F1分數最高到0.81。專家也認為這系統能減輕紀錄負擔,但偶爾還是會誤解醫療情境。這是首次針對急診醫療紀錄自動化做系統性評估,展現未來應用潛力。 PubMed DOI