Evaluation of Online AI-Generated Foot and Ankle Surgery Information.
評估線上 AI 生成的足踝外科資訊。 J Foot Ankle Surg 2024-07-05

研究比較了OpenAI ChatGPT Chatbot和FootCareMD®提供的足踝外科資訊。結果顯示，FootCareMD®的資訊易讀性高且品質優於ChatGPT。研究指出，AI查詢可能提供高級資訊，但可靠性較低。在診斷治療足踝狀況時，應考慮資訊品質。 PubMed DOI

Do ChatGPT and Gemini Provide Appropriate Recommendations for Pediatric Orthopaedic Conditions?
ChatGPT 和 Gemini 是否對小兒骨科疾病提供適當的建議？ J Pediatr Orthop 2024-08-22

這項研究評估了大型語言模型（LLMs），如ChatGPT和Gemini，在提供小兒骨科疾病建議的可靠性，並參考了美國骨科醫學會（AAOS）的指導方針。結果顯示，ChatGPT和Gemini的符合率分別為67%和69%，差異不大。值得注意的是，ChatGPT沒有引用任何研究，而Gemini則參考了16項研究，但大多數存在錯誤或不一致。總體來看，這些模型雖然在某程度上符合指導方針，但仍有許多中立或不正確的陳述，顯示醫療AI模型需改進與提高透明度。 PubMed DOI

Chatbots in Limb Lengthening and Reconstruction Surgery: How Accurate Are the Responses?
肢體延長與重建手術中的聊天機器人：其回應的準確性如何？ J Pediatr Orthop 2024-12-11

這項研究評估了三個AI聊天機器人—ChatGPT、Google Bard和Microsoft Copilot—在小兒骨科肢體重建手術問題上的回答準確性。研究者提出23個常見問題，並由三位骨科醫生用4分制評分。結果顯示，ChatGPT的回答最準確，評價為令人滿意，幾乎不需澄清；而Microsoft Copilot的回答準確性最低，需要中等程度的澄清。這顯示在醫療領域，特別是專業領域，聊天機器人的信息可靠性有差異。 PubMed DOI

Pediatric Supracondylar Humerus and Diaphyseal Femur Fractures: A Comparative Analysis of Chat Generative Pretrained Transformer and Google Gemini Recommendations Versus American Academy of Orthopaedic Surgeons Clinical Practice Guidelines.
小兒肱骨上髁骨折與股骨幹骨折：Chat Generative Pretrained Transformer 和 Google Gemini 建議與美國骨科醫學會臨床實踐指導方針的比較分析。 J Pediatr Orthop 2025-01-14

這項研究評估了三款AI聊天機器人（ChatGPT-4.0、ChatGPT-3.5和Google Gemini）在美國骨科醫學會針對小兒肱骨上髁骨折和股骨幹骨折的建議中的準確性。結果顯示，ChatGPT-4.0和Google Gemini的準確率較高，分別為11項和9項建議。雖然所有機器人都提供了補充資訊，但修改需求各異，且可讀性方面Google Gemini表現較佳。整體而言，這些工具在小兒骨科病人教育上仍需改進。 PubMed DOI

A Study of Orthopedic Patient Leaflets and Readability of AI-Generated Text in Foot and Ankle Surgery (SOLE-AI).
足踝外科病患手冊及人工智慧生成文本可讀性研究 (SOLE-AI)。 Cureus 2025-01-17

網路與人工智慧（AI）已改變現代醫學，讓醫療資訊更易獲取，但病人的自主權仍需依賴清晰準確的資訊。本文評估AI生成的足踝手術資訊質量與可讀性，結果顯示AI生成的資訊可讀性差，準確性與質量不如人類生成的資料。AI的資訊理解需要更高的教育水平，可能會誤導病人。因此，建議在臨床諮詢中使用來自專業機構的資訊，因為目前AI在知情同意過程中的應用證據仍不足。 PubMed DOI

Evaluating the Quality and Readability of Generative Artificial Intelligence (AI) Chatbot Responses in the Management of Achilles Tendon Rupture.
評估生成式人工智慧 (AI) 聊天機器人在跟腱斷裂管理中的回應質量和可讀性。 Cureus 2025-03-04

這項研究評估了六款生成式AI聊天機器人在跟腱斷裂相關問題上的可讀性和回應質量，目的是探討它們作為病人教育工具的潛力。分析的聊天機器人包括ChatGPT 3.5、ChatGPT 4、Gemini 1.0、Gemini 1.5 Pro、Claude和Grok。結果顯示，Gemini 1.0的可讀性最佳，對一般讀者最易理解；而在回應質量上，Gemini 1.0和ChatGPT 4的表現優於其他模型。整體而言，這些聊天機器人都能提供高於平均水平的資訊，顯示出它們在病人教育上的價值。 PubMed DOI

ChatGPT and Google Gemini are Clinically Inadequate in Providing Recommendations on Management of Developmental Dysplasia of the Hip Compared to American Academy of Orthopaedic Surgeons Clinical Practice Guidelines.
ChatGPT 與 Google Gemini 在發育性髖關節發育不良（Developmental Dysplasia of the Hip）管理建議上，與美國骨科醫學會臨床指引相比，臨床表現不足 J Pediatr Soc North Am 2025-05-28

這項研究比較ChatGPT-4.0、ChatGPT-3.5和Google Gemini在回答DDH醫學問題時的表現。結果發現，三款AI的答案準確性都有限，常常有錯誤或遺漏重點。雖然準確度差不多，但Google Gemini的內容最容易閱讀。建議醫師要提醒病患，AI醫療資訊還有很多限制，不能完全依賴。 PubMed DOI

AI Chatbots in Pediatric Orthopedics: How Accurate Are Their Answers to Parents' Questions on Bowlegs and Knock Knees?
兒童骨科中的 AI 聊天機器人：它們對家長關於 O 型腿與 X 型腿問題的回答有多準確？ Healthcare (Basel) 2025-06-13

這項研究比較了三款AI聊天機器人回答兒童O型腿和X型腿問題的表現。結果發現，ChatGPT和Gemini的答案比Copilot更正確、內容也更完整，但三者在表達清楚度和錯誤資訊風險上差不多。整體來說，AI可以協助提供健康資訊，但在兒科醫療領域，專家審核還是很重要。 PubMed DOI

Assessing the Accuracy of Artificial Intelligence Chatbots in the Diagnosis and Management of Meniscal Tears.
人工智慧聊天機器人在診斷與治療半月板撕裂準確性的評估 Cureus 2025-06-16

這項研究比較ChatGPT-4o和Gemini 2.0 Flash在回答半月板撕裂常見問題的準確性。兩者回答句數和可驗證比例差不多。只用UpToDate驗證，約58%內容正確；加上期刊文章則提升到84%。兩款AI準確度沒顯著差異，但多元驗證來源能提升正確性。總結來說，AI可輔助骨科衛教，但還是無法取代醫師專業判斷。 PubMed DOI

Assessing Accuracy of Chat Generative Pre-Trained Transformer's Responses to Common Patient Questions Regarding Congenital Upper Limb Differences.
Chat Generative Pre-Trained Transformer 回應常見先天性上肢差異患者問題之準確性評估 J Hand Surg Glob Online 2025-06-16

這項研究發現，ChatGPT-4.0在回答先天性上肢差異常見問題時，大約一半答案正確且清楚，但有8%內容不夠好或可能誤導。回答內容深度和完整性不一，且很少建議諮詢專業醫師。總結來說，ChatGPT提供的資訊大致可靠，但不夠全面或個人化，建議病人衛教時要小心使用。 PubMed DOI

原始文章

站上相關主題文章列表