Performance of ChatGPT on Solving Orthopedic Board-Style Questions: A Comparative Analysis of ChatGPT 3.5 and ChatGPT 4.
ChatGPT 在解決骨科考試風格問題上的表現：ChatGPT 3.5 與 ChatGPT 4 的比較分析。 Clin Orthop Surg 2024-08-02

這項研究評估了ChatGPT 3.5和4在回答骨科考試問題的表現，使用了來自首爾國立大學醫院的160道問題，分為11個子類別。結果顯示，ChatGPT 3.5的正確率為37.5%，而ChatGPT 4提升至60.0%（p < 0.001）。大部分類別中，ChatGPT 4表現較佳，唯獨在腫瘤相關問題上不如3.5。此外，ChatGPT 4的回答不一致率顯著低於3.5（9.4%對比47.5%）。雖然ChatGPT 4在骨科考試中表現不錯，但仍需謹慎對待其不一致的回答和錯誤解釋。 PubMed DOI

Enhancing patient information texts in orthopaedics: How OpenAI's 'ChatGPT' can help.
提升骨科病患資訊文本：OpenAI 的 'ChatGPT' 如何提供協助。 J Exp Orthop 2024-09-18

這項研究指出，網路醫療資訊在骨科領域的使用越來越普遍，但也面臨品質挑戰。研究評估了25個網站，並針對10個網站使用髖部資訊評分系統（HISS）進行分析。最初的平均分數為9.5，顯示品質不佳。經過ChatGPT的建議後，分數提升至21.5，顯示出優秀的品質。結果顯示，ChatGPT能顯著改善線上病人資訊的品質，成為骨科醫生創建教育材料的有力工具，雖然無法取代專業知識，但能提升醫療資訊的可及性與品質。 PubMed DOI

Presentation suitability and readability of ChatGPT's medical responses to patient questions about on knee osteoarthritis.
ChatGPT 對於患者關於膝關節骨關節炎問題的醫學回應的呈現適宜性和可讀性。 Health Informatics J 2025-01-19

本研究評估了ChatGPT對膝關節骨關節炎（OA）問題的回答，特別在適宜性和可讀性方面。分析30個回答後發現，其可讀性分數超過建議的六年級水平，但內容常缺乏高品質細節。提供指示後，回答的可讀性略有改善，但詳細與簡化指示之間並無顯著差異。總結來說，ChatGPT雖然提供豐富資訊，但難以閱讀且質量不足，未來需進一步提升其使用者友好性和實用性。 PubMed DOI

ChatGPT is a comprehensive education tool for patients with patellar tendinopathy, but it currently lacks accuracy and readability.
ChatGPT 是一個針對髕腱病患者的綜合教育工具，但目前在準確性和可讀性方面存在不足。 Musculoskelet Sci Pract 2025-02-03

生成式 AI 工具如 ChatGPT 在醫療查詢中越來越受歡迎，特別是在解答髕腱病相關問題上。一項研究評估了 ChatGPT-4 的表現，收集了 48 個問題並由專家評估其回應。結果顯示，只有 33% 的回應準確，但 75% 是全面的。治療相關問題的準確率僅 17%。回應的可讀性達到大學水平，且可理解性良好（83%），但可行性較低（60%）。總體而言，ChatGPT-4 提供了豐富資訊，但準確性不足，且對於低學歷者不易理解。 PubMed DOI

Artificial Intelligence Shows Limited Success in Improving Readability Levels of Spanish-language Orthopaedic Patient Education Materials.
人工智慧在改善西班牙語骨科病人教育材料的可讀性方面顯示有限的成功。 Clin Orthop Relat Res 2025-02-12

這項研究指出，西班牙語患者在獲取骨科教育材料時面臨語言障礙和可讀性問題。評估77份美國骨科醫師學會的西班牙語材料後發現，沒有一份符合建議的六年級閱讀水平。使用ChatGPT-4簡化後，53%的材料達到建議水平，但準確性和實用性仍需改善。研究強調持續創建清晰且文化適宜的教育資源的重要性，並建議進一步研究以納入患者反饋。 PubMed DOI

Comparing ChatGPT 3.5 and 4.0 in Low Back Pain Patient Education: Addressing Strengths Limitations, and Psychosocial Challenges.
比較 ChatGPT 3.5 和 4.0 在下背痛患者教育中的應用：應對優勢、限制及心理社會挑戰。 World Neurosurg 2025-02-14

這項研究評估了AI工具，特別是ChatGPT 3.5和4.0，在提供低背痛患者教育的效果。結果顯示，ChatGPT 4.0在回應質量上明顯優於3.5，得分分別為1.03和2.07，且可靠性得分也較高。兩者在心理社會因素的問題上表現不佳，顯示出臨床醫生在這類情感敏感問題上的監督是必要的。未來發展應著重提升AI在心理社會方面的能力。 PubMed DOI

Leveraging ChatGPT to Produce Patient Education Materials for Common Hand Conditions.
利用 ChatGPT 製作常見手部疾病的病患教育材料。 J Hand Surg Glob Online 2025-02-24

這項研究評估了ChatGPT 3.5和4.0生成的病人教育材料（PEMs）在可讀性上的表現，針對常見手部疾病進行分析。研究發現，ChatGPT 4.0在啟發階段後，有28%的內容達到六年級閱讀水平，而3.5則沒有生成合適的內容。整體來看，4.0在所有可讀性指標上均優於3.5，顯示出其在提升病人教育和健康素養方面的潛力，未來隨著進一步改進，這一潛力將更為明顯。 PubMed DOI

Evaluating if ChatGPT Can Answer Common Patient Questions Compared With OrthoInfo Regarding Rotator Cuff Tears.
評估 ChatGPT 是否能夠回答有關肩袖撕裂的常見病人問題，並與 OrthoInfo 進行比較。 J Am Acad Orthop Surg Glob Res Rev 2025-03-13

這項研究評估了ChatGPT對旋轉袖撕裂病人常見問題的回答能力，並比較了標準與六年級閱讀水平的回應。結果顯示，標準回應在準確性（4.7）和適當性（4.5）上優於六年級回應（3.6和3.7），且差異顯著（P < 0.001）。不過，標準回應的準確性和適當性仍低於OrthoInfo（準確性4.7對5.0，適當性4.5對5.0）。雖然標準回應較佳，但可讀性卻不如OrthoInfo。結論建議，ChatGPT不應作為病人資訊的唯一來源，但可作為骨科醫生資訊的補充。 PubMed DOI

Improving Readability of Shoulder and Elbow Surgery Online Patient Education Material with Chat Generative Pretrained Transformer (ChatGPT) 4.
利用 Chat Generative Pretrained Transformer (ChatGPT) 4 改善肩膀和肘部手術線上病患教育材料的可讀性。 J Shoulder Elbow Surg 2025-03-21

健康素養對醫生與病人溝通非常重要，特別是手術病人需要理解複雜的程序。美國醫學會建議病人教育材料應以六到八年級的閱讀水平撰寫，但許多線上資源卻較難懂。研究人員分析了三十段有關肩膀和肘部手術的資訊，發現原始文本的可讀性達到十年級。使用ChatGPT-4簡化後，文本可讀性顯著提高，降至八年級水平。這顯示AI能有效簡化醫療資訊，但仍需人類審查以確保準確性。 PubMed DOI

Assessing the Usability of ChatGPT Responses Compared to Other Online Information in Hand Surgery.
評估 ChatGPT 回應的可用性與其他線上資訊在手外科中的比較。 Hand (N Y) 2025-04-12

這項研究評估了手部手術相關的線上醫療資訊，並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。主要發現包括： 1. **可讀性**：Google的回應較易讀，平均在八年級水平，而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**：ChatGPT-4的可靠性與3.5相似，但低共識主題的可讀性較低，準確性差異不大。 3. **覆蓋範圍**：ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同，但在解剖學和病理生理學上相似。總結來說，雖然ChatGPT能提供可靠的醫療資訊，但可讀性較差，醫療提供者需注意其局限性。 PubMed DOI

原始文章

站上相關主題文章列表