ChatGPT's diagnostic performance based on textual vs. visual information compared to radiologists' diagnostic performance in musculoskeletal radiology.
ChatGPT在肌肉骨骼放射學中基於文本與視覺資訊的診斷表現，與放射科醫師的診斷表現相比較。 Eur Radiol 2024-07-12

研究比較了基於GPT-4的ChatGPT、基於GPT-4V的ChatGPT和放射科醫師在106個案例的肌肉骨骼放射學診斷準確性。結果顯示，基於GPT-4的ChatGPT準確率為43%，優於基於GPT-4V的ChatGPT的8%。放射科醫師的準確率分別為41%和53%。ChatGPT表現接近住院醫師，但不及認證放射科醫師。放射科醫師需了解ChatGPT的診斷表現，強調提供詳細影像描述以提高準確性。 PubMed DOI

Accuracy and Readability of ChatGPT on Potential Complications of Interventional Radiology Procedures: AI-Powered Patient Interviewing.
介入放射學程序潛在併發症的 ChatGPT 準確性與可讀性：AI 驅動的病人訪談。 Acad Radiol 2024-11-17

這項研究評估了ChatGPT-4在介入放射學程序潛在併發症資訊的準確性、可靠性和可讀性。兩位經驗豐富的醫師使用5點李克特量表對25個程序的回應進行評分，結果顯示評分一致性高（ICC達0.928）。可讀性評估顯示資訊通常達到大學水平，但可讀性較低。整體而言，ChatGPT-4在提供準確資訊方面表現良好，未出現幻覺，顯示其在病人教育上有潛力，但仍需高健康素養以理解這些資訊。 PubMed DOI

ChatGPT Assisting Diagnosis of Neuro-Ophthalmology Diseases Based on Case Reports.
基於案例報告的神經眼科疾病診斷輔助。 J Neuroophthalmol 2025-01-09

這項研究評估了ChatGPT（包含GPT-3.5和GPT-4）在診斷神經眼科疾病的準確性，使用了22個病例。結果顯示，GPT-3.5的正確診斷率為59%，而GPT-4提升至82%。相比之下，兩位神經眼科醫生的準確率為86%。GPT-4與專家的協議程度優於GPT-3.5，顯示出其在臨床診斷上的潛力，但仍需進一步研究以了解其在資源有限的環境中的應用。 PubMed DOI

Detection of Intracranial Hemorrhage from Computed Tomography Images: Diagnostic Role and Efficacy of ChatGPT-4o.
從電腦斷層掃描影像檢測顱內出血：ChatGPT-4o 的診斷角色與效能。 Diagnostics (Basel) 2025-01-25

本研究探討AI模型ChatGPT-4 Omni在非對比電腦斷層掃描影像中檢測顱內出血的有效性。分析240個案例後，發現該模型在識別影像模式上達到100%準確率，但在ICH檢測的準確率為68.3%。敏感性為79.2%，特異性57.5%。在第二次評估中，準確率提升至73.3%。雖然模型在識別影像模式和檢測ICH方面有潛力，但在出血定位和分類上仍有不足，建議進一步訓練以提升其醫療應用表現。 PubMed DOI

ChatGPT-4o's Performance in Brain Tumor Diagnosis and MRI Findings: A Comparative Analysis with Radiologists.
ChatGPT-4o 在腦腫瘤診斷和 MRI 影像中的表現：與放射科醫師的比較分析。 Acad Radiol 2025-02-09

這項研究評估了ChatGPT-4o在識別MRI影像及診斷腦腫瘤的表現，並與經驗豐富的放射科醫師進行比較。研究涵蓋46名腦腫瘤患者的術前MRI影像。結果顯示，ChatGPT-4o識別病變的準確率為95.7%，但在定位病變和區分腦外、腦內病變方面表現不佳。其診斷成功率僅為56.8%，遠低於放射科醫師的90.9-93.2%。雖然ChatGPT-4o在某些特徵識別上表現良好，但在診斷上仍需改進，未來有潛力成為放射科醫師的輔助工具。 PubMed DOI

An assessment of ChatGPT in error detection for thyroid ultrasound reports: A comparative study with ultrasound physicians.
對於甲狀腺超音波報告中錯誤檢測的 ChatGPT 評估：與超音波醫師的比較研究。 Digit Health 2025-03-17

這項研究評估了GPT-4o在識別ACR TIRADS超音波報告錯誤的有效性及其加速報告生成的能力。分析了福建醫科大學第二附屬醫院的200份甲狀腺超音波報告，結果顯示GPT-4o成功檢測到90%的錯誤，接近資深醫師的93%。在效率上，GPT-4o的審查速度明顯快於醫師，平均只需0.79小時，而醫師則需1.8到3.1小時。研究結果顯示，GPT-4o不僅在錯誤檢測上表現優異，還能顯著提升報告處理效率，對於改善診斷準確性及支持住院醫師非常有幫助。 PubMed DOI

Assessing the Accuracy, Completeness and Safety of ChatGPT-4o Responses on Pressure Injuries in Infants: Clinical Applications and Future Implications.
ChatGPT-4o 回應嬰兒壓力性損傷的準確性、完整性與安全性之評估：臨床應用與未來展望 Nurs Rep 2025-05-07

這項研究發現，ChatGPT-4對嬰兒壓力性損傷護理問題的回答，大多正確且安全，特別適合用於護理教育和臨床決策。不過，在醫療器材管理等主題表現較弱，建議持續更新資料，才能更可靠地應用於臨床。 PubMed DOI

ChatGPT-4-Driven Liver Ultrasound Radiomics Analysis: Advantages and Drawbacks Compared to Traditional Techniques.
ChatGPT-4 驅動的肝臟超音波放射組學分析：相較於傳統技術的優勢與缺點 JMIR AI 2025-05-19

這項研究發現，ChatGPT-4能用於肝臟超音波影像分析，準確率達76%、敏感度83%，表現接近傳統軟體，但分析速度快40%。雖然診斷準確率還有進步空間，但展現出AI自動化醫學影像分析的潛力。 PubMed DOI

The Accuracy of ChatGPT-4o in Interpreting Chest and Abdominal X-Ray Images.
ChatGPT-4o 在解讀胸部與腹部 X 光影像的準確性 J Pers Med 2025-05-27

這項研究發現，ChatGPT-4o在判讀X光片時，整體正確率約69%，腹部X光片表現比胸部好。它對常見異常如肺水腫、腸阻塞較準確，但對氣胸、肋骨骨折較弱。雖然AI回覆都算安全，但目前準確率還不夠高，還需改進才能真正成為臨床輔助工具。 PubMed DOI

Post-deployment Monitoring of AI Performance in Intracranial Hemorrhage Detection by ChatGPT.
ChatGPT於顱內出血偵測中AI表現的部署後監測 Acad Radiol 2025-08-12

這篇研究發現，Aidoc AI在臨床上偵測頭部CT的顱內出血表現很好，放射科醫師用起來敏感度高、特異性也很棒。ChatGPT-4 Turbo也能準確從報告中抓出ICH，顯示自動化監控AI很有潛力。不過，Aidoc在某些掃描儀（像Philips）或影像雜訊多時，偽陽性會比較多。整體來說，持續監控AI表現很重要，結合大型語言模型能提升效率與可靠度。 PubMed DOI

原始文章

站上相關主題文章列表