Title: Can ChatGPT 4.0 Reliably Answer Patient Frequently Asked Questions About Boxer's Fractures?
ChatGPT 4.0 能否可靠地回答患者關於拳擊手骨折的常見問題？ Hand Surg Rehabil 2025-01-11

這項研究評估了ChatGPT 4.0在回答有關拳擊手骨折的常見問題的準確性。研究人員從五個可信醫療來源中挑選出十大問題，並請三位手部骨科專家根據A-F的評分標準進行評分。結果顯示，ChatGPT的整體評分為B，表示答案通常足夠，但需小幅澄清。值得注意的是，7個回答建議使用者諮詢醫療專業人員。一般性問題得分較高（A-），而管理相關問題得分較低（C+）。整體而言，ChatGPT能有效回答有關拳擊手骨折的問題。 PubMed DOI

Evaluating the Evolution of ChatGPT as an Information Resource in Shoulder and Elbow Surgery.
評估 ChatGPT 作為肩膀和肘部外科資訊資源的演變。 Orthopedics 2025-01-29

這項研究評估了ChatGPT（3.5和4版本）在提供肩膀和肘部手術資訊的準確性，分析了114個問題。結果顯示，ChatGPT 3.5的正確率為52.3%，而ChatGPT 4則達到73.3%。雖然3.5在不穩定性類別表現較佳，但4在大多數其他類別中表現更優。兩者的表現都超過50%的熟練度，但仍無法取代臨床決策。研究建議進一步改善ChatGPT的訓練，以提升其作為醫療資訊資源的效用。 PubMed DOI

Leveraging ChatGPT to Produce Patient Education Materials for Common Hand Conditions.
利用 ChatGPT 製作常見手部疾病的病患教育材料。 J Hand Surg Glob Online 2025-02-24

這項研究評估了ChatGPT 3.5和4.0生成的病人教育材料（PEMs）在可讀性上的表現，針對常見手部疾病進行分析。研究發現，ChatGPT 4.0在啟發階段後，有28%的內容達到六年級閱讀水平，而3.5則沒有生成合適的內容。整體來看，4.0在所有可讀性指標上均優於3.5，顯示出其在提升病人教育和健康素養方面的潛力，未來隨著進一步改進，這一潛力將更為明顯。 PubMed DOI

Matching Human Expertise: ChatGPT's Performance on Hand Surgery Examinations.
匹配人類專業知識：ChatGPT 在手外科考試中的表現。 Hand (N Y) 2025-03-21

這項研究評估了ChatGPT 4o在美國手外科學會（ASSH）自我評估問題上的表現，並與先前版本比較。研究使用2008至2013年的ASSH考試數據，透過OpenAI的API進行統計分析。結果顯示，ChatGPT 4o在增強技術的幫助下，表現與人類考生相當，明顯超越ChatGPT 3.5，且測試的可靠性很高。這些發現顯示，人工智慧，特別是ChatGPT，能有效支持醫學教育和臨床實踐，達到與人類專家相似的評估水平。 PubMed DOI

Assessing the quality of ChatGPT's responses to commonly asked questions about trigger finger treatment.
評估 ChatGPT 對於常見的 trigger finger 治療問題的回答質量。 Ulus Travma Acil Cerrahi Derg 2025-04-11

這項研究評估了ChatGPT在回答有關觸發指的病人問題的有效性，目的是改善病人教育並探討人工智慧的角色。研究人員整理了十個常見問題，並根據《美國醫學會雜誌》（JAMA）和DISCERN工具的標準評估ChatGPT的回答。結果顯示，ChatGPT的回答質量中等，60%被認為滿意，但40%有缺陷，主要是缺乏科學參考資料。此外，回答的可讀性達到大學水平，對健康素養較低的病人來說理解上有挑戰。結論指出，雖然ChatGPT能提供一般資訊，但在作為病人主要教育資源前，需專家監督。這是首個專門檢視ChatGPT在觸發指情境中的研究。 PubMed DOI

Assessing the Usability of ChatGPT Responses Compared to Other Online Information in Hand Surgery.
評估 ChatGPT 回應的可用性與其他線上資訊在手外科中的比較。 Hand (N Y) 2025-04-12

這項研究評估了手部手術相關的線上醫療資訊，並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。主要發現包括： 1. **可讀性**：Google的回應較易讀，平均在八年級水平，而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**：ChatGPT-4的可靠性與3.5相似，但低共識主題的可讀性較低，準確性差異不大。 3. **覆蓋範圍**：ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同，但在解剖學和病理生理學上相似。總結來說，雖然ChatGPT能提供可靠的醫療資訊，但可讀性較差，醫療提供者需注意其局限性。 PubMed DOI

Comparison of ChatGPT's Diagnostic and Management Accuracy of Foot and Ankle Bone-Related Pathologies to Orthopaedic Surgeons.
ChatGPT 在足踝骨骼相關病變之診斷與治療準確度與骨科醫師的比較 J Am Acad Orthop Surg 2025-04-15

這項研究發現，ChatGPT-4在診斷和建議治療足踝骨骼損傷時表現不錯，能準確給出標準答案，且不會亂編內容。不過，它在提供更深入或超出標準的醫療建議時還有不足。整體來說，對病患或非專科醫師來說，ChatGPT-4是有潛力的輔助工具，但資訊深度有限。 PubMed DOI

Assessing the quality and readability of ChatGPT responses to frequently asked questions about trigger finger release.
ChatGPT 回應常見有關板機指鬆解手術問題之品質與可讀性評估 J Plast Reconstr Aesthet Surg 2025-04-29

這項研究發現，ChatGPT-4回答板機指手術相關問題時，大多內容正確且表達清楚，但偶爾會有事實錯誤，尤其在治療部分。AI的回答閱讀難度偏高，約等同高中三年級，超過建議給病人的國中程度。建議AI可作為衛教輔助，但醫護人員仍需協助病人確認資訊正確性。 PubMed DOI

Advancing emergency upper extremity care: A pilot study of ChatGPT's potential role in diagnosing and managing hand and wrist trauma.
提升急診上肢照護：ChatGPT 在診斷與處理手部及腕部創傷潛在角色的初步研究 J Hand Microsurg 2025-05-12

這項研究發現，ChatGPT-4 在診斷和處理常見手部、手腕創傷時，表現和整形外科住院醫師差不多，甚至在急診處置上更優秀。AI 有潛力成為急診室醫師的好幫手，但還是建議當作輔助工具，不能完全取代專業醫師的判斷。 PubMed DOI

Assessing Accuracy of Chat Generative Pre-Trained Transformer's Responses to Common Patient Questions Regarding Congenital Upper Limb Differences.
Chat Generative Pre-Trained Transformer 回應常見先天性上肢差異患者問題之準確性評估 J Hand Surg Glob Online 2025-06-16

這項研究發現，ChatGPT-4.0在回答先天性上肢差異常見問題時，大約一半答案正確且清楚，但有8%內容不夠好或可能誤導。回答內容深度和完整性不一，且很少建議諮詢專業醫師。總結來說，ChatGPT提供的資訊大致可靠，但不夠全面或個人化，建議病人衛教時要小心使用。 PubMed DOI

原始文章

站上相關主題文章列表