Comparative Evaluation of Large Language and Multimodal Models in Detecting Spinal Stabilization Systems on X-Ray Images.
大型語言與多模態模型於X光影像中偵測脊椎穩定系統之比較性評估
J Clin Med 2025-05-28
ChatGPT's diagnostic performance based on textual vs. visual information compared to radiologists' diagnostic performance in musculoskeletal radiology.
ChatGPT在肌肉骨骼放射學中基於文本與視覺資訊的診斷表現,與放射科醫師的診斷表現相比較。
Eur Radiol 2024-07-12
Evaluating the Adherence of Large Language Models to Surgical Guidelines: A Comparative Analysis of Chatbot Recommendations and North American Spine Society (NASS) Coverage Criteria.
評估大型語言模型對外科指導方針的遵循性:Chatbot 建議與北美脊柱學會 (NASS) 覆蓋標準的比較分析。
Cureus 2024-10-04
The performance of ChatGPT-4.0oin medical imaging evaluation: a preliminary investigation.
ChatGPT-4.0 在醫學影像評估中的表現:初步研究。
J Educ Eval Health Prof 2024-10-30
Comparative Analysis of Large Language Models and Spine Surgeons in Surgical Decision-Making and Radiological Assessment for Spine Pathologies.
大型語言模型與脊椎外科醫生在脊椎病理的手術決策與影像評估中的比較分析。
World Neurosurg 2024-12-02
Comparative Analysis of M4CXR, an LLM-Based Chest X-Ray Report Generation Model, and ChatGPT in Radiological Interpretation.
M4CXR:一種基於大型語言模型的胸部X光報告生成模型與ChatGPT在放射學解讀中的比較分析。
J Clin Med 2024-12-17
本研究評估了兩種人工智慧工具,M4CXR 和 ChatGPT-4o,在解讀胸部 X 光片的診斷能力。研究分析了826張影像,結果顯示M4CXR在準確性和一致性上均優於ChatGPT,診斷準確性分別為60-62%和42-45%。M4CXR在解剖定位的準確性達76-77.5%,而ChatGPT僅36-36.5%。研究強調這些技術的互補潛力,建議結合人工智慧與臨床判斷,以提升病患護理結果。
PubMedDOI
Evaluating ChatGPT's Performance in Classifying Pertrochanteric Fractures Based on Arbeitsgemeinschaft für Osteosynthesefragen/Orthopedic Trauma Association (AO/OTA) Standards.
根據 Arbeitsgemeinschaft für Osteosynthesefragen/Orthopedic Trauma Association (AO/OTA) 標準評估 ChatGPT 在分類股骨轉子骨折方面的表現。
Cureus 2025-02-28
Evaluating the Diagnostic Accuracy of ChatGPT-4.0 for Classifying Multimodal Musculoskeletal Masses: A Comparative Study with Human Raters.
ChatGPT-4.0 在分類多模態肌肉骨骼腫塊之診斷準確性的評估:與人工評分者之比較研究
Rofo 2025-06-03