Diagnostic Accuracy of Differential-Diagnosis Lists Generated by Generative Pretrained Transformer 3 Chatbot for Clinical Vignettes with Common Chief Complaints: A Pilot Study.
由生成預訓練變換器3聊天機器人生成的不同診斷清單對具有常見主訴的臨床案例的診斷準確性：一項初步研究。 Int J Environ Res Public Health 2023-11-17

研究發現ChatGPT-3對臨床案例診斷的正確率為93.3%，但醫師的正確率高達98.3%，且更擅長辨識頂級診斷。ChatGPT-3生成的診斷清單中，醫師間一致性為70.5%。總結來說，AI聊天機器人在診斷方面有潛力，但排序仍有改進空間。 PubMed DOI

Performance of emergency triage prediction of an open access natural language processing based chatbot application (ChatGPT): A preliminary, scenario-based cross-sectional study.
開放式自然語言處理聊天機器人應用(ChatGPT)在急診分流預測表現的初步情境跨部門研究。 Turk J Emerg Med 2023-08-03

人工智慧公司致力改進聊天機器人，讓它能更貼近人類對話。研究發現OpenAI的ChatGPT在急診醫學分類上表現不錯，對高危病例的預測尤其準確，有助於辨識重症護理需求。雖然還有些許過度或不足分類的情況，但隨著更多醫學訓練，ChatGPT的準確性將會提升。 PubMed DOI

The potential of chatbots in chronic venous disease patient management.
慢性靜脈疾病患者管理中聊天機器人的潛力。 JVS Vasc Insights 2023-09-15

醫療保健提供者和病患正在使用人工智慧，像是ChatGPT，透過對話介面來取得醫學資訊。研究發現ChatGPT 4.0在回答行政性和複雜的醫學問題上表現優於其他聊天機器人，顯示未來進一步發展和訓練後，ChatGPT等聊天機器人有潛力協助電子健康記錄管理。 PubMed DOI

Efficacy of AI Chats to Determine an Emergency: A Comparison Between OpenAI's ChatGPT, Google Bard, and Microsoft Bing AI Chat.
AI聊天機器人在判斷緊急情況的效能：OpenAI的ChatGPT、Google Bard和Microsoft Bing AI Chat之比較。 Cureus 2023-09-21

研究比較三款熱門的人工智慧聊天機器人在處理網上論壇病人問題時，區分醫療緊急和非緊急情況的準確度。機器人傾向將更多情況當成緊急，難以分辨非緊急情況。Google Bard在區分真正緊急和非緊急情況上表現最好。總結來說，這些機器人在準確判斷緊急情況方面還有進步的空間，但有潛力成為緊急護理工具，改善病人結果，提供緩解緊急服務壓力的解決方案。 PubMed DOI

Embracing the future-is artificial intelligence already better? A comparative study of artificial intelligence performance in diagnostic accuracy and decision-making.
掌握未來-人工智慧已經更好了嗎？人工智慧在診斷準確性和決策表現的比較研究。 Eur J Neurol 2024-03-14

研究比較了基於GPT-3.5的AI聊天機器人和神經學醫師在臨床案例中的診斷和決策表現。結果顯示，AI聊天機器人在神經學領域的表現相當不錯，正確率高達85%，並能提供96.1%的案例充分理由。研究指出AI可作為神經學臨床推理的輔助工具，未來應用前景廣闊。 PubMed DOI

Human intelligence versus Chat-GPT: who performs better in correctly classifying patients in triage?
人類智慧對抗 Chat-GPT：在正確分類三角患者方面，誰的表現更好？ Am J Emerg Med 2024-02-11

Chat-GPT被討論用於醫療，但研究顯示在急診室中，醫護人員比Chat-GPT更準確評估病情風險。目前Chat-GPT尚無法取代人類專業知識，顯示AI在此領域仍需進一步提升。 PubMed DOI

Performance of Artificial Intelligence (AI)-Powered Chatbots in the Assessment of Medical Case Reports: Qualitative Insights From Simulated Scenarios.
人工智慧（AI）驅動的聊天機器人在醫學病例報告評估中的表現：來自模擬情境的定性見解。 Cureus 2024-03-12

研究比較了知名的人工智慧聊天機器人在區分嚴重和較不嚴重的醫療症狀上的表現，並評估了它們的準確性和具有同理心的溝通方式。研究分析了三個聊天機器人對醫療緊急情況和非緊急情況的案例報告。這些聊天機器人提供了合理的診斷和緊急性評估，但在回應的詳情和長度上有所不同。儘管它們提供指導，但在廣泛應用於醫療問題之前，仍需要謹慎和進一步研究。 PubMed DOI

Assessing ChatGPT 4.0's test performance and clinical diagnostic accuracy on USMLE STEP 2 CK and clinical case reports.
評估 ChatGPT 4.0 在美國醫師執照考試第二步臨床知識測驗（USMLE STEP 2 CK）和臨床病例報告中的測試表現和臨床診斷準確性。 Sci Rep 2024-04-23

研究發現，ChatGPT 4.0 在回答美國醫師執照考試問題及生成臨床鑑別診斷方面比 3.5 更準確。在74.6%案例中準確生成診斷，70.2%正確將診斷排第一。顯示ChatGPT在回答醫學問題上有進步，並展現臨床診斷能力。 PubMed DOI

Performance evaluation of ChatGPT in detecting diagnostic errors and their contributing factors: an analysis of 545 case reports of diagnostic errors.
ChatGPT 在檢測診斷錯誤及其影響因素方面的表現評估：對545份診斷錯誤案例報告的分析。 BMJ Open Qual 2024-06-03

手動檢視病歷並使用確認過的評估工具是一種常見的方法，用來找出診斷錯誤，但需要花費大量資源。ChatGPT是一個AI聊天機器人，能根據提示幫忙分類文本。研究顯示，在545個有診斷錯誤的病例中，ChatGPT在95%的情況下準確檢測出錯誤，並比醫師更能找出每個病例的貢獻因素。ChatGPT最常辨識的因素是未考慮或延誤診斷以及非典型表現。在檢測診斷錯誤和貢獻因素方面，ChatGPT展現出潛力，尤其是在非典型表現的病例中。 PubMed DOI

The scientific knowledge of three large language models in cardiology: multiple-choice questions examination-based performance.
心臟病學中三個大型語言模型的科學知識：基於多重選擇問題考試表現。 Ann Med Surg (Lond) 2024-06-07

研究比較了AI聊天機器人在心臟病學領域的表現，發現ChatGPT 4.0的準確率最高，Bing次之，Bard最低。ChatGPT在各個心臟病學主題上表現都很好。研究指出ChatGPT 4.0可作為心臟病學教育的重要資源，但也提醒要持續評估和改進Bard等機器人，確保醫學知識的準確性。 PubMed DOI

原始文章

站上相關主題文章列表