Repeatability, reproducibility, and diagnostic accuracy of a commercial large language model (ChatGPT) to perform emergency department triage using the Canadian triage and acuity scale.
使用商業大型語言模型（ChatGPT）進行急診部分流程評估的重複性、再現性和診斷準確性。 CJEM 2024-01-17

2022年11月推出的ChatGPT原型讓人工智慧更容易取得，但一項研究發現，使用加拿大分級和急性評估量表進行患者分類的急診醫師發現ChatGPT不可靠。研究顯示，ChatGPT在不同情境下的表現不穩定，可能無法在重要任務中提供準確和一致的資訊。 PubMed DOI

Reliability of ChatGPT for performing triage task in the emergency department using the Korean Triage and Acuity Scale.
ChatGPT 在急診部使用韓國分流及嚴重度評估表進行分流任務的可靠性。 Digit Health 2024-01-23

研究評估了在醫療環境中使用人工智慧技術ChatGPT進行急診部分流程的可靠性。結果顯示人類評分員和ChatGPT有中等程度的一致性，新版本表現更好。ChatGPT展示了在急診醫療環境中提高分流準確性的潛力，特別是在經驗有限的人員情況下。 PubMed DOI

Assessing the precision of artificial intelligence in ED triage decisions: Insights from a study with ChatGPT.
評估人工智慧在急診分流決策中的精確性：ChatGPT 研究的洞察。 Am J Emerg Med 2024-03-25

這項研究探討使用人工智慧，特別是基於GPT-4的ChatGPT，來預測急診部的分流結果。研究涉及比較AI工具所做的決策與急診醫學專家的決策，專家的決策被視為黃金標準。結果顯示AI工具與專家之間有高度一致性，顯示ChatGPT有潛力有效地協助病人的分流。 PubMed DOI

Human intelligence versus Chat-GPT: who performs better in correctly classifying patients in triage?
人類智慧對抗 Chat-GPT：在正確分類三角患者方面，誰的表現更好？ Am J Emerg Med 2024-02-11

Chat-GPT被討論用於醫療，但研究顯示在急診室中，醫護人員比Chat-GPT更準確評估病情風險。目前Chat-GPT尚無法取代人類專業知識，顯示AI在此領域仍需進一步提升。 PubMed DOI

Assessing the utility of artificial intelligence throughout the triage outpatients: a prospective randomized controlled clinical study.
評估人工智慧在門診分流中的效用：一項前瞻性隨機對照臨床研究。 Front Public Health 2024-06-14

ChatGPT是一個由AI驅動的工具，用來協助門診分流。研究顯示，ChatGPT與手動分流結果高度一致，專家對其回答大多給予正面評價。另外，一項涵蓋45名患者的研究也顯示ChatGPT表現優異。ChatGPT的回答專業、全面且人性化，有助於改善治療時間、診斷，並緩解醫療人力不足問題，讓患者受益。 PubMed DOI

Triage Performance Across Large Language Models, ChatGPT, and Untrained Doctors in Emergency Medicine: Comparative Study.
緊急醫學中大型語言模型、ChatGPT 和未受訓醫生的分流表現：比較研究。 J Med Internet Res 2024-06-14

研究評估LLMs和ChatGPT在急診室分流的效果，與受訓與否的人員比較。結果顯示LLMs和ChatGPT表現不錯，但沒有超越專業人員。雖然在此研究中未顯著改善未受訓醫生的工作，但新LLMs版本經更多訓練後有潛力提升。 PubMed DOI

Emergency department triaging using ChatGPT based on emergency severity index principles: a cross-sectional study.
基於緊急嚴重性指數原則的 ChatGPT 緊急部門分診：一項橫斷面研究。 Sci Rep 2024-09-27

這項研究探討了ChatGPT在急診部門使用緊急嚴重指數（ESI）進行病人分診的效果。研究對象為18歲以上、24小時內來急診的病人，收集了年齡、性別、主訴和生命徵象等資料。五位專家根據ESI標準評估病人緊急程度，並與ChatGPT的評估結果進行比較。結果顯示，專家與ChatGPT之間的協議程度中等，Cohen's Kappa值為0.659，準確率76.6%。在高急迫性類別中，協議程度更強，顯示ChatGPT在識別高急迫性病人方面具有效能，顯示人工智慧在急診分診中的潛力。 PubMed DOI

Accuracy of a Commercial Large Language Model (ChatGPT) to Perform Disaster Triage of Simulated Patients Using the Simple Triage and Rapid Treatment (START) Protocol: Gage Repeatability and Reproducibility Study.
商業大型語言模型 (ChatGPT) 在使用簡單分診與快速治療 (START) 協議對模擬病人進行災難分診的準確性：Gage 重複性與再現性研究。 J Med Internet Res 2024-09-30

這項研究探討了ChatGPT在模擬災難病人分診的有效性，使用了391個病人案例和九個提示進行測試，總共產生了35,190次模擬分診。結果顯示，99.7%的查詢得到了有效的START評分，但變異性顯著。準確性為63.9%，過度分診率32.9%，不足分診率3.1%。研究結論指出，ChatGPT在醫療分診中表現不佳，提醒在臨床使用AI工具時需謹慎，並強調進行嚴謹的統計評估的重要性。 PubMed DOI

Exploring the potential of artificial intelligence models for triage in the emergency department.
探索人工智慧模型在急診部門分診的潛力。 Postgrad Med 2024-10-17

這項研究比較了三層級的分診協議，包括分診護士、急診醫師和人工智慧模型（ChatGPT、Gemini 和 Pi），在2024年4月1日至4月7日於一所三級醫療機構的急診部門進行，分析了500名病人的數據。結果顯示，只有23.8%的病人獲得一致分類，分診護士對6.4%的病人過度分診，且人工智慧模型的分診不足率偏高，特別是ChatGPT在黃碼和紅碼病人中分診不足達26.5%和42.6%。結論指出，急診環境中不應僅依賴人工智慧進行分診。 PubMed DOI

Evaluating LLM-based generative AI tools in emergency triage: A comparative study of ChatGPT Plus, Copilot Pro, and triage nurses.
評估基於大型語言模型的生成式人工智慧工具在緊急分診中的應用：ChatGPT Plus、Copilot Pro 與分診護士的比較研究。 Am J Emerg Med 2024-12-28

這項研究探討了人工智慧工具，如ChatGPT和Copilot，在繁忙的急診科進行病人分診的效果。研究持續一週，結果顯示護士的分診準確率為65.2%，而ChatGPT和Copilot分別為66.5%和61.8%，三者差異不大。不過，兩個AI工具在識別高危病人方面表現明顯優於護士。研究指出，AI能提升分診準確性，特別是對緊急病例的識別，並強調急診科即時容量數據的重要性。 PubMed DOI

原始文章

站上相關主題文章列表