Evaluating ChatGPT-4's Accuracy in Identifying Final Diagnoses Within Differential Diagnoses Compared With Those of Physicians: Experimental Study for Diagnostic Cases.
ChatGPT-4 在辨識差異診斷中最終診斷的準確性：與醫師對比的評估研究。診斷案例的實驗研究。 JMIR Form Res 2024-06-26

這項研究評估了由人工智慧驅動的聊天機器人GPT-4在醫學病例報告中從潛在診斷清單中識別最終診斷的能力。GPT-4在識別最終診斷方面與醫師表現出公平至良好的一致性，顯示其有潛力協助臨床決策。需要在真實世界情境和不同臨床環境中進行進一步驗證，以充分了解其在醫學診斷中的實用性。 PubMed DOI

ChatGPT's diagnostic performance based on textual vs. visual information compared to radiologists' diagnostic performance in musculoskeletal radiology.
ChatGPT在肌肉骨骼放射學中基於文本與視覺資訊的診斷表現，與放射科醫師的診斷表現相比較。 Eur Radiol 2024-07-12

研究比較了基於GPT-4的ChatGPT、基於GPT-4V的ChatGPT和放射科醫師在106個案例的肌肉骨骼放射學診斷準確性。結果顯示，基於GPT-4的ChatGPT準確率為43%，優於基於GPT-4V的ChatGPT的8%。放射科醫師的準確率分別為41%和53%。ChatGPT表現接近住院醫師，但不及認證放射科醫師。放射科醫師需了解ChatGPT的診斷表現，強調提供詳細影像描述以提高準確性。 PubMed DOI

Evaluation of ChatGPT as a diagnostic tool for medical learners and clinicians.
評估 ChatGPT 作為醫學學習者和臨床醫師的診斷工具。 PLoS One 2024-07-31

這項研究評估了ChatGPT在醫學訓練中的診斷準確性和教育效用。分析150個Medscape案例後，發現ChatGPT正確回答49%的案例，整體診斷準確率為74%。雖然在解讀實驗室數值和影像結果上有些限制，但它在教育上顯示出潛力，能有效排除某些鑑別診斷並建議後續步驟，讓複雜的醫學概念更易理解。未來研究應著重提升其教育能力。 PubMed DOI

Comparative analysis of GPT-4-based ChatGPT's diagnostic performance with radiologists using real-world radiology reports of brain tumors.
基於 GPT-4 的 ChatGPT 與放射科醫生在腦腫瘤實際放射學報告中的診斷表現比較分析。 Eur Radiol 2024-08-28

這項研究評估了GPT-4（特別是ChatGPT）在解讀腦腫瘤MRI報告的診斷能力。研究分析了150份術前病患的報告，結果顯示GPT-4的診斷準確率為73%，而神經放射科醫師則為80%。在鑑別診斷方面，GPT-4的準確率高達94%，放射科醫師則介於73%到89%之間。研究結果表明，GPT-4可作為神經放射科醫師的有用第二意見，並能成為一般放射科醫師和住院醫師的指導工具，顯示其在臨床診斷中的潛力。 PubMed DOI

Accuracy Evaluation of GPT-Assisted Differential Diagnosis in Emergency Department.
急診部門中 GPT 輔助鑑別診斷的準確性評估。 Diagnostics (Basel) 2024-08-29

在急診部門，快速且準確的診斷對病人結果和醫療效率非常重要。本研究評估了ChatGPT-3.5和ChatGPT-4在根據急診入院前24小時的電子健康紀錄生成鑑別診斷清單的表現。結果顯示，兩者在預測身體系統層級的診斷上都相當準確，GPT-4稍優於GPT-3.5，但在具體診斷類別上表現不一，精確度較低。值得注意的是，GPT-4在幾個關鍵類別中展現了更高的準確性，顯示其在處理複雜臨床情況上的優勢。 PubMed DOI

The Diagnostic Ability of GPT-3.5 and GPT-4.0 in Surgery: Comparative Analysis.
GPT-3.5 和 GPT-4.0 在外科診斷能力的比較分析。 J Med Internet Res 2024-09-10

這項研究評估了ChatGPT在診斷結腸癌的能力，特別是比較GPT-3.5和GPT-4.0的表現。研究分析了286份腸癌病例，結果顯示GPT-4.0在初診和次診的準確率均高於GPT-3.5，分別為0.972對0.855和0.908對0.617。雖然GPT-4.0在處理病史和實驗室數據上有所改善，但在識別症狀方面仍有挑戰。整體而言，GPT-4.0在臨床輔助診斷中展現出潛力，但仍需進一步研究以克服其限制。 PubMed DOI

Generative pre-trained transformer (GPT)-4 support for differential diagnosis in neuroradiology.
GPT-4 在神經放射學中對鑑別診斷的支持。 Quant Imaging Med Surg 2024-10-21

這項研究評估了GPT-4在神經放射學中生成鑑別診斷的效果，並與專業神經放射科醫師進行比較。研究分析了60份報告，結果顯示GPT-4在61.7%的案例中正確包含實際診斷，而醫師的準確率在63.3%到73.3%之間。GPT-4與醫師的協議程度被評為公平到中等。雖然GPT-4在輔助放射學工作上顯示潛力，但準確性仍不及人類專家，這強調了了解其局限性的重要性。 PubMed DOI

Accuracy of a ChatGPT in Diagnosing Urologic Conditions from Cross-Sectional Imaging.
ChatGPT 在從橫斷面影像診斷泌尿科疾病的準確性。 Urology 2024-11-27

這項研究評估了ChatGPT在泌尿科醫學影像解讀的有效性，特別是CT和MRI影像。結果顯示，ChatGPT在14%的CT和28%的MRI案例中準確識別首要診斷，雖然無顯著差異，但加入器官指導後，CT影像的準確率提升了18%。整體來看，雖然ChatGPT的初步有效性有限，但在用戶指導下，其表現可顯著改善，顯示AI在臨床應用中的潛力與限制。 PubMed DOI

Evaluation of ChatGPT 4.0 in Thoracic Imaging and Diagnostics.
ChatGPT 4.0 在胸部影像學和診斷中的評估。 Cureus 2024-12-16

最近，自然語言處理（NLP）在醫療領域的進展顯著，特別是在數據分析和診斷方面。OpenAI的ChatGPT 4.0被評估在胸部影像診斷的表現，整體準確率達84.9%。它在術語和診斷徵象上表現優異，重症監護和正常解剖的準確率分別為90%和80%。在病理問題上，平均準確率為89.1%，但在某些疾病如肺癌的表現較差。總體來看，ChatGPT 4.0顯示出潛力，但仍需進一步研究以提升其臨床應用的可靠性。 PubMed DOI

Preliminary evaluation of ChatGPT model iterations in emergency department diagnostics.
急診科診斷中 ChatGPT 模型迭代的初步評估。 Sci Rep 2025-03-27

這項回顧性研究評估了不同ChatGPT模型（如GPT-3.5、GPT-4等）在預測急診病人診斷的表現。研究針對30名病人，發現GPT-3.5在前三名鑑別診斷的準確率高達80%，但主要診斷的準確率僅47.8%。較新的模型如chatgpt-4o-latest在主要診斷的準確率提升至60%。要求模型提供推理過程也有助於改善表現。不過，所有模型在處理非典型案例時仍面臨挑戰，顯示其在急診環境中的應用限制。 PubMed DOI

原始文章

站上相關主題文章列表