這項研究評估了多模態人工智慧模型 GPT-4V 在解讀放射影像的表現,包括超音波、電腦斷層掃描和 X 光。分析230張急診影像後,模型在影像識別上達到100%準確率,但在解剖和病理識別上表現不佳,尤其是病理識別僅35.2%。儘管有潛力,GPT-4V 的診斷錯誤率超過40%,引發臨床使用的可靠性擔憂。研究強調需進一步開發以提升準確性,確保病人安全,並指出目前不宜作為獨立診斷工具。
PubMedDOI
Evaluating GPT-4o's Performance in the Official European Board of Radiology Exam: A Comprehensive Assessment.
評估 GPT-4o 在歐洲放射學官方考試中的表現:全面評估。
Acad Radiol 2024-09-18
Generative pre-trained transformer (GPT)-4 support for differential diagnosis in neuroradiology.
GPT-4 在神經放射學中對鑑別診斷的支持。
Quant Imaging Med Surg 2024-10-21
Evaluating the Role of GPT-4 and GPT-4o in the Detectability of Chest Radiography Reports Requiring Further Assessment.
評估 GPT-4 和 GPT-4o 在需要進一步評估的胸部放射線報告可檢測性中的角色。
Cureus 2025-01-13
Evaluating a large language model's accuracy in chest X-ray interpretation for acute thoracic conditions.
評估大型語言模型在急性胸部疾病胸部 X 光解讀中的準確性。
Am J Emerg Med 2025-04-02