Performance of ChatGPT on Solving Orthopedic Board-Style Questions: A Comparative Analysis of ChatGPT 3.5 and ChatGPT 4.
ChatGPT 在解決骨科考試風格問題上的表現：ChatGPT 3.5 與 ChatGPT 4 的比較分析。 Clin Orthop Surg 2024-08-02

這項研究評估了ChatGPT 3.5和4在回答骨科考試問題的表現，使用了來自首爾國立大學醫院的160道問題，分為11個子類別。結果顯示，ChatGPT 3.5的正確率為37.5%，而ChatGPT 4提升至60.0%（p < 0.001）。大部分類別中，ChatGPT 4表現較佳，唯獨在腫瘤相關問題上不如3.5。此外，ChatGPT 4的回答不一致率顯著低於3.5（9.4%對比47.5%）。雖然ChatGPT 4在骨科考試中表現不錯，但仍需謹慎對待其不一致的回答和錯誤解釋。 PubMed DOI

ChatGPT as a Source for Patient Information on Patellofemoral Surgery-A Comparative Study Amongst Laymen, Doctors, and Experts.
ChatGPT 作為髕股關節手術患者資訊的來源 - 一項普通人、醫生與專家之間的比較研究。 Clin Pract 2024-11-25

2022年11月，OpenAI推出了ChatGPT，引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力，並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估，結果顯示專家對ChatGPT的評分普遍較低，尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯，但隨著問題複雜度增加，其表現下降，顯示出人類專業知識在醫療中的重要性。 PubMed DOI

ChatGPT is an Unreliable Source of Peer-Reviewed Information for Common Total Knee and Hip Arthroplasty Patient Questions.
ChatGPT 對於常見全膝及全髖關節置換手術病患問題的同行評審資訊是不可靠的來源。 Adv Orthop 2025-01-16

隨著人工智慧和機器學習的進步，像ChatGPT這樣的工具對現代醫學和病人教育產生影響。本研究評估了ChatGPT對全膝關節置換術（TKA）和全髖關節置換術（THA）術前問題的回答有效性。結果顯示，ChatGPT引用的109個來源中，只有36%是準確的，且大多數來源的出版時間集中在2011至2015年。雖然其準確性評分為4.4/6，但引用不準確文獻的比例高達64.22%。因此，使用ChatGPT進行醫學查詢時需謹慎。 PubMed DOI

Evaluating the Evolution of ChatGPT as an Information Resource in Shoulder and Elbow Surgery.
評估 ChatGPT 作為肩膀和肘部外科資訊資源的演變。 Orthopedics 2025-01-29

這項研究評估了ChatGPT（3.5和4版本）在提供肩膀和肘部手術資訊的準確性，分析了114個問題。結果顯示，ChatGPT 3.5的正確率為52.3%，而ChatGPT 4則達到73.3%。雖然3.5在不穩定性類別表現較佳，但4在大多數其他類別中表現更優。兩者的表現都超過50%的熟練度，但仍無法取代臨床決策。研究建議進一步改善ChatGPT的訓練，以提升其作為醫療資訊資源的效用。 PubMed DOI

ChatGPT-4 Effectively Responds to Common Patient Questions on Total Ankle Arthroplasty: A Surgeon-Based Assessment of AI in Patient Education.
ChatGPT-4 有效回應關於全踝關節置換術的常見病人問題：基於外科醫生的人工智慧在病人教育中的評估。 Foot Ankle Orthop 2025-03-31

這項研究評估了ChatGPT-4在回答全踝關節置換術（TAA）相關問題的表現。研究人員提出十二個常見問題，並請四位專科外科醫生評分其回答的準確性和清晰度。平均得分為1.8（滿分4分），顯示在事實性問題上表現尚可，但對於術後方案等細緻問題評分較低。外科醫生的評分差異顯著，顯示出不同的解讀和期望。這強調了針對特定臨床情境設計AI工具的必要性，以提升病人教育和資訊的準確性。 PubMed DOI

Evaluation of ChatGPT Responses About Sexual Activity After Total Hip Arthroplasty: A Comparative Study with Observers of Different Experience Levels.
ChatGPT 回應全髖關節置換術後性生活相關問題之評估：與不同經驗層級觀察者的比較研究 J Clin Med 2025-05-14

這項研究發現，ChatGPT-4在回答全髖關節置換術後性生活相關問題時，表現普遍算是「尚可」，尤其適合用來做一般衛教，特別是面對敏感話題。不過，遇到需要更專業或個別化的情境時，ChatGPT的表現就比較有限，因此還是要依賴專業醫師的建議。 PubMed DOI

Evaluating retrieval augmented generation and ChatGPT's accuracy on orthopaedic examination assessment questions.
檢視檢索增強生成（Retrieval Augmented Generation）與 ChatGPT 在骨科檢查評量題目上的準確性 Ann Jt 2025-05-19

這項研究發現，結合RAG技術的ChatGPT-4在骨科考題上的表現，正確率約74%，跟骨科醫師差不多，也比沒用RAG的ChatGPT-4和3.5好。RAG還能讓AI引用資料來源，提升可信度，對骨科教學和考試準備很有幫助。 PubMed DOI

Adequacy of ChatGPT responses to frequently asked questions about shoulder arthroplasty: is it an appropriate adjunct for patient education?
ChatGPT 回應常見肩關節置換術問題的適切性：作為病患衛教輔助工具是否合適？ JSES Int 2025-06-09

這項研究發現，ChatGPT在回答肩關節置換手術常見問題時，只有一題被評為「優秀」，其他答案雖然還可以，但都不夠詳細。ChatGPT適合用來幫助病人和醫師溝通，但在治療細節和正確性上還有待加強。建議把它當作輔助工具，不能取代專業醫療意見，使用時也要有專業監督。 PubMed DOI

Comparative Efficacy of ChatGPT and DeepSeek in Addressing Patient Queries on Gonarthrosis and Total Knee Arthroplasty.
ChatGPT 與 DeepSeek 在回應關於膝關節炎（Gonarthrosis）及全膝關節置換術（Total Knee Arthroplasty）病患問題之效能比較 Arthroplast Today 2025-06-16

這項研究發現，ChatGPT在解釋膝關節置換手術及術後照護時，比DeepSeek更準確、讓人更滿意。不論病人還是骨科醫師，都比較推薦ChatGPT。顯示ChatGPT有機會成為病人衛教和減輕手術焦慮的好幫手。未來可再研究AI怎麼融入臨床，對治療結果有什麼影響。 PubMed DOI

A custom ChatGPT can accurately answer questions from an international expert osteotomy consensus statement.
一個自訂的 ChatGPT 能夠準確回答國際專家截骨術共識聲明中的問題。 Eur J Orthop Surg Traumatol 2025-06-16

這項研究測試了經過客製化訓練的ChatGPT，針對高脛骨截骨術（HTO）問題的回答能力，並以專家共識聲明為基礎。研究用10題測試AI，並由三位膝關節外科醫師評分。結果顯示，AI在正確性、相關性、清楚度和完整性方面表現都不錯，評審間一致性也高。雖然對非共識聲明的題目分數略低，但整體來說，這個AI有潛力成為外科醫師的輔助工具，也適合應用在其他醫療指引上。 PubMed DOI

原始文章

站上相關主題文章列表