ChatGPT Influence on Medical Decision-Making, Bias, and Equity: A Randomized Study of Clinicians Evaluating Clinical Vignettes.
ChatGPT對醫療決策、偏見和公平性的影響：醫師評估臨床案例的隨機研究。 medRxiv 2023-12-19

在一項研究中，美國持牌醫師使用了一個大型語言模型人工智慧系統，協助做出關於不同族群演員胸痛病例的臨床決策。這個人工智慧建議提高了決策的準確性，並沒有增加偏見。醫師對於在臨床決策中使用人工智慧工具持開放態度。 PubMed DOI

Exploring the potential of ChatGPT for clinical reasoning and decision-making: a cross-sectional study on the Italian Medical Residency Exam.
探索 ChatGPT 在臨床推理和決策方面的潛力：關於義大利醫學住院醫師考試的橫斷面研究。 Ann Ist Super Sanita 2023-12-16

研究發現ChatGPT在義大利醫師考試中表現優異，整體準確率達90.44%，臨床案例更高達92.45%，顯示其在醫學教育和臨床決策上有潛力。結果顯示ChatGPT可能成為臨床決策和推理的重要工具，值得進一步研究其在醫學教育和臨床實務中的應用。 PubMed DOI

FROM TEXT TO DIAGNOSE: CHATGPT'S EFFICACY IN MEDICAL DECISION-MAKING.
從文字到診斷：ChatGPT 在醫學決策中的效力。 Wiad Lek 2023-12-21

研究評估了ChatGPT在醫學診斷的表現，使用50個臨床案例。ChatGPT在結構化情境中表現準確，有時比醫師更好。它在圖像解釋上有困難，但在選擇潛在診斷方面表現優秀。研究強調了ChatGPT在臨床醫學中的潛力，並強調了補充數據和及時的工程技術對於與醫生有效互動的重要性。 PubMed DOI

Mixed methods assessment of the influence of demographics on medical advice of ChatGPT.
混合方法評估 ChatGPT 醫療建議受人口統計影響的研究。 J Am Med Inform Assoc 2024-04-29

研究比較了ChatGPT GPT-4與WebMD在診斷和健康建議上的表現，發現兩者診斷匹配率高達91%，且ChatGPT提供更多緊急護理建議和針對年長人口的定制。然而，對於種族、族裔或性別並無顯著差異。研究指出使用AI進行症狀檢查與傳統工具相當，但在相關文本中可能存在潛在偏見，需持續評估AI醫療平台以解決人口統計偏見，實現公平護理。 PubMed DOI

Performance evaluation of ChatGPT in detecting diagnostic errors and their contributing factors: an analysis of 545 case reports of diagnostic errors.
ChatGPT 在檢測診斷錯誤及其影響因素方面的表現評估：對545份診斷錯誤案例報告的分析。 BMJ Open Qual 2024-06-03

手動檢視病歷並使用確認過的評估工具是一種常見的方法，用來找出診斷錯誤，但需要花費大量資源。ChatGPT是一個AI聊天機器人，能根據提示幫忙分類文本。研究顯示，在545個有診斷錯誤的病例中，ChatGPT在95%的情況下準確檢測出錯誤，並比醫師更能找出每個病例的貢獻因素。ChatGPT最常辨識的因素是未考慮或延誤診斷以及非典型表現。在檢測診斷錯誤和貢獻因素方面，ChatGPT展現出潛力，尤其是在非典型表現的病例中。 PubMed DOI

Evaluation of ChatGPT-Generated Differential Diagnosis for Common Diseases With Atypical Presentation: Descriptive Research.
ChatGPT生成的常見疾病非典型表現的鑑別診斷評估：描述性研究。 JMIR Med Educ 2024-06-25

研究發現ChatGPT在辨識非典型疾病表現上有一定準確性，但對高度非典型案例的表現較差。儘管對典型和輕微非典型案例有潛力，但隨著非典型性增加，表現也下降。研究強調AI系統需結合多樣語言能力和臨床情境，以提升現實世界的診斷效果。 PubMed DOI

Evaluating ChatGPT-4's Accuracy in Identifying Final Diagnoses Within Differential Diagnoses Compared With Those of Physicians: Experimental Study for Diagnostic Cases.
ChatGPT-4 在辨識差異診斷中最終診斷的準確性：與醫師對比的評估研究。診斷案例的實驗研究。 JMIR Form Res 2024-06-26

這項研究評估了由人工智慧驅動的聊天機器人GPT-4在醫學病例報告中從潛在診斷清單中識別最終診斷的能力。GPT-4在識別最終診斷方面與醫師表現出公平至良好的一致性，顯示其有潛力協助臨床決策。需要在真實世界情境和不同臨床環境中進行進一步驗證，以充分了解其在醫學診斷中的實用性。 PubMed DOI

Evaluation of ChatGPT as a diagnostic tool for medical learners and clinicians.
評估 ChatGPT 作為醫學學習者和臨床醫師的診斷工具。 PLoS One 2024-07-31

這項研究評估了ChatGPT在醫學訓練中的診斷準確性和教育效用。分析150個Medscape案例後，發現ChatGPT正確回答49%的案例，整體診斷準確率為74%。雖然在解讀實驗室數值和影像結果上有些限制，但它在教育上顯示出潛力，能有效排除某些鑑別診斷並建議後續步驟，讓複雜的醫學概念更易理解。未來研究應著重提升其教育能力。 PubMed DOI

Accuracy Evaluation of GPT-Assisted Differential Diagnosis in Emergency Department.
急診部門中 GPT 輔助鑑別診斷的準確性評估。 Diagnostics (Basel) 2024-08-29

在急診部門，快速且準確的診斷對病人結果和醫療效率非常重要。本研究評估了ChatGPT-3.5和ChatGPT-4在根據急診入院前24小時的電子健康紀錄生成鑑別診斷清單的表現。結果顯示，兩者在預測身體系統層級的診斷上都相當準確，GPT-4稍優於GPT-3.5，但在具體診斷類別上表現不一，精確度較低。值得注意的是，GPT-4在幾個關鍵類別中展現了更高的準確性，顯示其在處理複雜臨床情況上的優勢。 PubMed DOI

Testing the Ability and Limitations of ChatGPT to Generate Differential Diagnoses from Transcribed Radiologic Findings.
測試 ChatGPT 生成放射學發現的鑑別診斷能力與限制。 Radiology 2024-10-15

這項研究評估了ChatGPT（GPT-3.5和GPT-4）在根據放射學轉錄生成鑑別診斷的表現。分析了339個案例，結果顯示GPT-4的準確性較高，正確診斷比例為66.1%，而GPT-3.5為53.7%。雖然GPT-4在準確性和虛構參考文獻方面表現較佳，但兩者在重複性上仍有問題。總體來看，ChatGPT在醫學上可作為有用工具，但使用時需謹慎以避免不準確性。 PubMed DOI

原始文章

站上相關主題文章列表