Generative Artificial Intelligence Responses to Common Patient-Centric Hand and Wrist Surgery Questions: A Quality and Usability Analysis.
針對常見病人中心的手部和手腕手術問題的生成式人工智慧回應：質量和可用性分析。 J Hand Surg Asian Pac Vol 2025-01-08

這項研究評估了兩個AI平台（Gemini和ChatGPT）對手部和手腕手術常見問題的回答質量。共提出12個問題，分析48個回答，使用三種評分工具進行評估。結果顯示，回答的平均分數為55.7（良好）、57.2%（足夠）和4.4。手腕相關問題的回答質量顯著高於手部問題，且Gemini在評分上優於ChatGPT。雖然AI的回答通常被評為良好，但質量因平台和問題類型而異，了解這些差異對病人尋求資訊至關重要。 PubMed DOI

Assessing ChatGPT Responses to Frequently Asked Questions Regarding Pediatric Supracondylar Humerus Fractures.
評估 ChatGPT 對於小兒肱骨上髁骨折常見問題的回答。 J Pediatr Orthop 2025-02-07

這項研究評估了ChatGPT在回答小兒肱骨上髁骨折相關問題的效果。研究中提出七個常見問題，並根據回答的清晰度和準確性進行分類。結果顯示，四個回答雖然滿意，但仍需澄清；三個則不滿意，缺乏準確性和清晰度。沒有任何回答被評為優秀。研究指出，ChatGPT提供的資訊雖有幫助，但通常需要進一步澄清，特別是在治療方案上。因此，建議家長應諮詢醫療專業人員以獲得準確指導。這項評估屬於五級專家意見。 PubMed DOI

Exploring the Utility of ChatGPT in Cleft Lip Repair Education.
探討 ChatGPT 在唇裂修復教育中的應用價值。 J Clin Med 2025-02-13

本研究探討ChatGPT在唇裂修復方面的回應質量與準確性，因為大型語言模型在健康資訊傳播中越來越常見。研究選取十個常見問題，並由五位整形外科醫師評估其內容質量、清晰度、相關性和可信度。結果顯示，ChatGPT的平均評分為2.9分，清晰度和內容質量較高，但可信度較低。可讀性適合約10年級學生。雖然回應中無明顯不準確或有害資訊，但缺乏引用來源，使用者需注意其局限性。 PubMed DOI

ChatGPT-3.5 and -4.0 Do Not Reliably Create Readable Patient Education Materials for Common Orthopaedic Upper- and Lower-Extremity Conditions.
ChatGPT-3.5 和 -4.0 在創建常見骨科上下肢疾病的可讀患者教育材料方面不可靠。 Arthrosc Sports Med Rehabil 2025-03-05

這項研究評估了ChatGPT-3.5和ChatGPT-4.0在生成病人教育材料的效果，針對常見的上肢和下肢骨科疾病進行分析。結果顯示，ChatGPT-3.5的可讀性僅有2%和4%達標，而ChatGPT-4.0則有54%達標，顯示出明顯的進步。雖然ChatGPT-4.0在可讀性上表現優異，但兩者仍被視為不可靠，無法完全取代傳統病人教育方式，應作為醫療提供者的輔助工具。 PubMed DOI

Assessing the Usability of ChatGPT Responses Compared to Other Online Information in Hand Surgery.
評估 ChatGPT 回應的可用性與其他線上資訊在手外科中的比較。 Hand (N Y) 2025-04-12

這項研究評估了手部手術相關的線上醫療資訊，並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。主要發現包括： 1. **可讀性**：Google的回應較易讀，平均在八年級水平，而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**：ChatGPT-4的可靠性與3.5相似，但低共識主題的可讀性較低，準確性差異不大。 3. **覆蓋範圍**：ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同，但在解剖學和病理生理學上相似。總結來說，雖然ChatGPT能提供可靠的醫療資訊，但可讀性較差，醫療提供者需注意其局限性。 PubMed DOI

Assessing the quality and readability of ChatGPT responses to frequently asked questions about trigger finger release.
ChatGPT 回應常見有關板機指鬆解手術問題之品質與可讀性評估 J Plast Reconstr Aesthet Surg 2025-04-29

這項研究發現，ChatGPT-4回答板機指手術相關問題時，大多內容正確且表達清楚，但偶爾會有事實錯誤，尤其在治療部分。AI的回答閱讀難度偏高，約等同高中三年級，超過建議給病人的國中程度。建議AI可作為衛教輔助，但醫護人員仍需協助病人確認資訊正確性。 PubMed DOI

Assessing information provided via artificial intelligence regarding distal biceps tendon repair surgery.
人工智慧提供之遠端肱二頭肌肌腱修復手術相關資訊的評估 J Exp Orthop 2025-05-20

這項研究發現，ChatGPT 3.5雖然能提供遠端肱二頭肌肌腱修復手術的相關資訊，品質算不錯，但缺乏來源、用詞太艱深，病患可能看不懂。醫師建議大家用ChatGPT查醫療資訊時要特別小心，內容不一定正確或容易理解。 PubMed DOI

Adequacy of ChatGPT responses to frequently asked questions about shoulder arthroplasty: is it an appropriate adjunct for patient education?
ChatGPT 回應常見肩關節置換術問題的適切性：作為病患衛教輔助工具是否合適？ JSES Int 2025-06-09

這項研究發現，ChatGPT在回答肩關節置換手術常見問題時，只有一題被評為「優秀」，其他答案雖然還可以，但都不夠詳細。ChatGPT適合用來幫助病人和醫師溝通，但在治療細節和正確性上還有待加強。建議把它當作輔助工具，不能取代專業醫療意見，使用時也要有專業監督。 PubMed DOI

Evaluating AI Chatbots for Preoperative and Postoperative Counseling for Mandibular Distraction Osteogenesis.
用於下頜骨牽引成骨術術前與術後衛教諮詢之 AI 聊天機器人評估 J Craniofac Surg 2025-06-09

這項研究發現，AI 聊天機器人（像是ChatGPT、Copilot等）在回答兒童下頜骨延長術常見照護問題時，雖然Copilot表現最好，但整體來說，答案不夠可靠、資料來源不足，而且用詞太艱深，病人和家屬很難看懂，暫時還不適合當作醫療諮詢的主要工具。 PubMed DOI

Exploring ChatGPT's Efficacy in Orthopaedic Arthroplasty Questions Compared to Adult Reconstruction Surgeons.
ChatGPT 在骨科關節置換問題上的效能：與成人重建外科醫師的比較 Arthroplast Today 2025-07-23

這項研究發現，ChatGPT-4在回答關節置換相關問題時，正確率只有66.9%，明顯低於骨科研究員和主治醫師。特別是在有圖片的題目上，表現更差。雖然ChatGPT可當作學習輔助，但還無法取代專業醫師的臨床判斷，未來還需更多研究來提升AI在醫療領域的應用。 PubMed DOI

原始文章

站上相關主題文章列表