Evaluating ChatGPT responses in the context of a 53-year-old male with a femoral neck fracture: a qualitative analysis.
在一名患有股骨頸骨折的53歲男性背景下評估ChatGPT回應：一項質性分析。 Eur J Orthop Surg Traumatol 2024-03-23

研究指出，在骨科手術中使用AI工具ChatGPT時，雖然能提供相關回答，但有時也會給出不適當的答案。這顯示了在臨床實務中應用ChatGPT的潛力與限制，強調了在醫療領域使用AI工具需謹慎驗證與整合。未來需進一步研究並加強臨床醫師培訓，以確保像ChatGPT這樣的AI工具在臨床決策中的安全可靠性。 PubMed DOI

Large-Scale assessment of ChatGPT's performance in benign and malignant bone tumors imaging report diagnosis and its potential for clinical applications.
ChatGPT 在良性和惡性骨腫瘤影像報告診斷中的大規模評估及其在臨床應用中的潛力。 J Bone Oncol 2024-02-06

研究使用AI技術，如ChatGPT和few-shot learning，來協助診斷良性和惡性骨腫瘤。分析1366份影像報告後發現，ChatGPT經過few-shot learning後，準確率從0.73提升至0.87，顯示潛力。研究也討論放射科醫師的報告風格對模型表現的影響，並辨識出誤診案例。強調AI需與醫師合作，才能真正應用。這研究奠定未來醫學診斷AI進步基礎，凸顯few-shot learning在專業領域的優勢。 PubMed DOI

Evaluating ChatGPT's Capabilities on Orthopedic Training Examinations: An Analysis of New Image Processing Features.
評估 ChatGPT 在骨科培訓考試中的能力：對新影像處理功能的分析。 Cureus 2024-04-11

研究發現ChatGPT 4.0在回答骨科手術問題時表現良好，尤其在無需圖像的情況下更為準確。儘管人工智慧在骨科領域有潛力，仍需提升準確性。未來研究應致力於有效運用人工智慧來輔助而非取代醫生的技能。 PubMed DOI

Can Large Language Models (LLMs) Predict the Appropriate Treatment of Acute Hip Fractures in Older Adults? Comparing Appropriate Use Criteria With Recommendations From ChatGPT.
大型語言模型 (LLMs) 能否預測老年人急性髖骨骨折的適當治療？比較適當使用標準與 ChatGPT 的建議。 J Am Acad Orthop Surg Glob Res Rev 2024-08-13

急性髖部骨折對公共健康，特別是老年人，造成重大挑戰。本研究評估ChatGPT-4.0在提供骨折治療建議的準確性，並與美國骨科醫學會（AAOS）的標準進行比較。結果顯示，ChatGPT-4.0的評分與AAOS有正相關，但在長髖髓釘的評估上存在顯著差異，且高估了全髖關節置換等治療的適當性。總體而言，ChatGPT-4.0在急性髖部骨折治療建議上不完全可靠，需進一步改進以符合醫療指導方針，提升病人治療效果。 PubMed DOI

Artificial Intelligence in Orthopaedics: Performance of ChatGPT on Text and Image Questions on a Complete AAOS Orthopaedic In-Training Examination (OITE).
人工智慧在骨科的應用：ChatGPT 在完整的 AAOS 骨科住院醫師訓練考試 (OITE) 中對文本和影像問題的表現。 J Surg Educ 2024-09-16

這項研究評估了ChatGPT 4.0在2019年骨科住院醫師訓練考試中的表現。結果顯示，ChatGPT在純文字問題的正確率為49%，而帶有圖片的問題為48%。當圖片描述由AI生成時，表現下降6%。整體來看，ChatGPT的表現低於所有住院醫師班級，尤其比一年級住院醫師低4%。研究指出，雖然ChatGPT在醫學考試中有一定能力，但仍未達到住院醫師的水準，顯示AI在醫學教育中的潛力與限制。 PubMed DOI

Exploring the Performance of ChatGPT in an Orthopaedic Setting and Its Potential Use as an Educational Tool.
探索 ChatGPT 在骨科環境中的表現及其作為教育工具的潛在用途。 JB JS Open Access 2024-11-27

這項研究評估了ChatGPT-4視覺版（GPT-4V）在解讀醫學影像及處理骨科創傷案例的表現。研究分析了十個來自OrthoBullets的熱門案例，並由四位專科醫生對AI的回應進行評分。結果顯示，GPT-4V在影像回應的平均得分為3.46，準確性和可信度較低，分別為3.28和3.15；而在管理問題上得分較高（3.76），治療問題表現最佳（4.04）。結論指出，GPT-4V作為教育工具有潛力，但影像解讀能力仍不及經驗豐富的醫生。 PubMed DOI

Diagnostic performance of ChatGPT in tibial plateau fracture in knee X-ray.
ChatGPT 在膝關節 X 光片中診斷脛骨平台骨折的表現。 Emerg Radiol 2024-11-29

這項研究評估了ChatGPT在膝關節X光片識別脛骨平台骨折的準確性，分析了111張X光片，其中29例經CT確認為骨折。結果顯示，急診醫師和放射科醫師的表現明顯優於ChatGPT-4，尤其在敏感度上。雖然ChatGPT-4o在特異度上表現接近醫師，但整體診斷能力仍不及人類專家。總之，ChatGPT-4o顯示出潛力，但尚未達到醫師的診斷水準。 PubMed DOI

High identification and positive-negative discrimination but limited detailed grading accuracy of ChatGPT-4o in knee osteoarthritis radiographs.
ChatGPT-4o 在膝關節骨關節炎放射影像中的高識別率和正負鑑別能力，但詳細分級準確性有限。 Knee Surg Sports Traumatol Arthrosc 2025-03-07

本研究探討ChatGPT-4o在分析膝關節骨關節炎（OA）X光片的能力，並評估其準確性。117張X光片由兩位骨科醫生和ChatGPT-4o分析，使用多種分級系統。結果顯示，ChatGPT-4o的識別率達100%，但詳細分級準確性僅35%，遠低於醫生的89.6%。此外，ChatGPT-4o在嚴重病例中常低估OA程度，且其評分一致性較差。雖然能快速識別，但在臨床應用上仍需提升分級準確性。未來研究應聚焦於改善這方面的表現。 PubMed DOI

Breaking Bones, Breaking Barriers: ChatGPT, DeepSeek, and Gemini in Hand Fracture Management.
打破骨頭，打破障礙：ChatGPT、DeepSeek 和 Gemini 在手部骨折管理中的應用。 J Clin Med 2025-03-27

這項研究評估了三個人工智慧模型—ChatGPT-4o、DeepSeek-V3 和 Gemini 1.5—在手部骨折診斷與治療建議的有效性，並與經驗豐富的外科醫生進行比較。結果顯示，ChatGPT-4o的準確率最高，但精確度較低；DeepSeek-V3表現中等，偶爾漏掉正確方案；而Gemini 1.5則表現不佳。結論指出，雖然AI能增強臨床流程，但在複雜案例中仍無法取代人類專業，且需解決倫理問題才能廣泛應用。 PubMed DOI

The Challenges of Using ChatGPT for Clinical Decision Support in Orthopaedic Surgery: A Pilot Study.
使用 ChatGPT 進行骨科手術臨床決策支持的挑戰：一項初步研究。 J Am Acad Orthop Surg 2025-03-28

這項研究探討了人工智慧，特別是ChatGPT-4，在分析複雜臨床數據及生成合理評估和計畫的能力，特別針對骨科手術。研究聚焦於急診部門的十種常見骨折，利用患者的諮詢紀錄來提供AI所需的病史和檢查結果。結果顯示，ChatGPT-4能產出安全且合理的計畫，與多專科會議的臨床結果相符。雖然對大型語言模型的評估仍在發展中，但這項研究顯示AI在臨床決策中的潛力，未來可考慮以實際臨床結果作為基準。 PubMed DOI

原始文章

站上相關主題文章列表