ChatGPT's diagnostic performance based on textual vs. visual information compared to radiologists' diagnostic performance in musculoskeletal radiology.
ChatGPT在肌肉骨骼放射學中基於文本與視覺資訊的診斷表現，與放射科醫師的診斷表現相比較。 Eur Radiol 2024-07-12

研究比較了基於GPT-4的ChatGPT、基於GPT-4V的ChatGPT和放射科醫師在106個案例的肌肉骨骼放射學診斷準確性。結果顯示，基於GPT-4的ChatGPT準確率為43%，優於基於GPT-4V的ChatGPT的8%。放射科醫師的準確率分別為41%和53%。ChatGPT表現接近住院醫師，但不及認證放射科醫師。放射科醫師需了解ChatGPT的診斷表現，強調提供詳細影像描述以提高準確性。 PubMed DOI

Revolution or risk?-Assessing the potential and challenges of GPT-4V in radiologic image interpretation.
革命還是風險？- 評估 GPT-4V 在放射影像解讀中的潛力與挑戰。 Eur Radiol 2024-10-18

這項研究評估了ChatGPT-4 Vision在解讀臨床影像（如X光、CT、MRI等）的表現。分析了206個影像研究，結果顯示提供臨床上下文能顯著提高診斷準確率，從8.3%提升至29.1%和63.6%。但在30天和90天後重新評估時，準確率下降多達30%。雖然建議診斷與實際發現匹配率高達92.7%，但GPT-4V仍虛構了258個發現，並錯誤識別了65個案例。總體來看，GPT-4V目前無法可靠解讀放射影像，需進一步改進以確保病人安全。 PubMed DOI

Evaluating ChatGPT-4 for the Interpretation of Images from Several Diagnostic Techniques in Gastroenterology.
評估 ChatGPT-4 在消化內科多種診斷技術影像解讀中的應用。 J Clin Med 2025-01-25

這項研究評估了ChatGPT-4在解讀各種胃腸科影像的表現，分析了740張影像，並將預測結果與既有診斷進行比較。結果顯示，ChatGPT-4的準確性在不同程序中差異明顯，膠囊內視鏡的準確率介於50%到90%之間，設備輔助腸鏡為67%，而內視鏡超音波和高解析度肛門鏡的表現則較差。整體來看，這顯示ChatGPT-4的診斷能力尚不理想，臨床應用前仍需進一步改進。 PubMed DOI

ChatGPT-4o's Performance in Brain Tumor Diagnosis and MRI Findings: A Comparative Analysis with Radiologists.
ChatGPT-4o 在腦腫瘤診斷和 MRI 影像中的表現：與放射科醫師的比較分析。 Acad Radiol 2025-02-09

這項研究評估了ChatGPT-4o在識別MRI影像及診斷腦腫瘤的表現，並與經驗豐富的放射科醫師進行比較。研究涵蓋46名腦腫瘤患者的術前MRI影像。結果顯示，ChatGPT-4o識別病變的準確率為95.7%，但在定位病變和區分腦外、腦內病變方面表現不佳。其診斷成功率僅為56.8%，遠低於放射科醫師的90.9-93.2%。雖然ChatGPT-4o在某些特徵識別上表現良好，但在診斷上仍需改進，未來有潛力成為放射科醫師的輔助工具。 PubMed DOI

Evaluating a large language model's accuracy in chest X-ray interpretation for acute thoracic conditions.
評估大型語言模型在急性胸部疾病胸部 X 光解讀中的準確性。 Am J Emerg Med 2025-04-02

這項研究探討了使用ChatGPT 4.0搭配「X-Ray Interpreter」來解讀急診胸部X光片。分析了1,400張來自NIH的影像，涵蓋七種病理類別。ChatGPT在識別正常X光片方面表現優異，敏感度達98.9%，特異度93.9%。對於肺炎和氣胸的診斷表現較好，但在肺不張和肺氣腫上則較差。總體來看，ChatGPT作為輔助診斷工具顯示潛力，但對於更細微的診斷仍需改進，未來可與專業影像識別模型整合以提升能力。 PubMed DOI

Evaluating artificial intelligence performance in medical image analysis: Sensitivity, specificity, accuracy, and precision of ChatGPT-4o on Kellgren-Lawrence grading of knee X-ray radiographs.
醫學影像分析中人工智慧表現之評估：ChatGPT-4o 在膝關節 X 光片 Kellgren-Lawrence 分級的敏感度、特異度、準確度與精確度 Knee 2025-04-24

這項研究發現，ChatGPT-4o在判讀膝關節X光片和分級骨關節炎時，表現遠不如專業放射科醫師，準確率只有0.23，幾乎無法正確分辨不同等級。結果顯示，目前ChatGPT-4o還不適合用在這類臨床診斷，未來還需要大幅改進。 PubMed DOI

Evaluating ChatGPT-4's Performance in Identifying Radiological Anatomy in FRCR Part 1 Examination Questions.
ChatGPT-4 在 FRCR 第一部分考試題目中辨識放射解剖學表現之評估 Indian J Radiol Imaging 2025-04-29

這項研究發現，ChatGPT-4在回答FRCR Part 1放射解剖學題目時，辨認解剖結構的正確率很低（僅4–7.5%），但能正確判斷影像檢查方式。對於影像中有出現但非指定結構的辨識，表現較好（超過五成接近正確），但左右判斷仍有困難（約四成正確）。整體來說，ChatGPT-4目前在放射解剖影像判讀上還有很大進步空間。 PubMed DOI

Can Gpt-4o Accurately Diagnose Trauma X-Rays? A Comparative Study with Expert Evaluations.
Gpt-4o 能準確診斷創傷 X 光片嗎？與專家評估的比較研究 J Emerg Med 2025-05-10

最新研究發現，OpenAI的GPT-4o在判讀創傷X光片時，正確率僅11.2%，遠低於急診和骨科醫師的82.8%及87.2%。這顯示AI目前還無法取代專業醫師，醫學影像診斷還是得靠人類專業判斷。 PubMed DOI

Evaluating the Diagnostic Accuracy of ChatGPT-4.0 for Classifying Multimodal Musculoskeletal Masses: A Comparative Study with Human Raters.
ChatGPT-4.0 在分類多模態肌肉骨骼腫塊之診斷準確性的評估：與人工評分者之比較研究 Rofo 2025-06-03

研究發現，ChatGPT-4.0在判讀肌肉骨骼腫瘤影像時，主要診斷正確率低於人類專家（44%比87%），但若加上次要診斷，差距縮小（71%比94%）。雖然準確度還不及專家，但因為速度快又隨時可用，未來有機會成為放射科的輔助工具。 PubMed DOI

GPT-4 vs. Radiologists: who advances mediastinal tumor classification better across report quality levels? A cohort study.
GPT-4 vs. 放射科醫師：誰能在不同報告品質層級下更好地推進縱膈腫瘤分類？一項世代研究 Int J Surg 2025-08-11

這項研究發現，GPT-4在判讀胸部CT報告、分類縱膈腫瘤的準確率達73.3%，跟資深放射科醫師差不多。特別是在報告品質較差或診斷淋巴瘤時，GPT-4表現甚至更好。顯示GPT-4未來有機會協助醫師處理較難或資訊不足的病例。 PubMed DOI

原始文章

站上相關主題文章列表