Can Ordinary AI-Powered Tools Replace a Clinician-Led Fracture Clinic Appointment?
普通的人工智慧工具能否取代臨床醫師主導的骨折診所預約？ Cureus 2025-01-10

**引言** 人工智慧（AI）在醫療領域的應用日益普遍。本研究比較臨床醫師制定的骨折管理計畫與ChatGPT和Google Gemini生成的計畫。 **方法論** 本研究回顧70例孤立性骨折案例，排除複雜骨折和不明診斷。將臨床細節輸入AI，並比較其生成的計畫與實際文件計畫，重點在治療建議和後續策略。 **結果** Google Gemini僅有19%案例符合實際計畫，主要因過度概括和模糊性。ChatGPT則有34%符合，過度概括為主要差異。AI計畫與臨床計畫之間的差異具統計意義（p < 0.001）。 **結論** 這兩個AI工具在臨床管理計畫中顯示顯著不一致。雖然ChatGPT較接近專業知識，但兩者皆缺乏必要的臨床精確性，無法取代臨床醫師的角色。 PubMed DOI

Pediatric Supracondylar Humerus and Diaphyseal Femur Fractures: A Comparative Analysis of Chat Generative Pretrained Transformer and Google Gemini Recommendations Versus American Academy of Orthopaedic Surgeons Clinical Practice Guidelines.
小兒肱骨上髁骨折與股骨幹骨折：Chat Generative Pretrained Transformer 和 Google Gemini 建議與美國骨科醫學會臨床實踐指導方針的比較分析。 J Pediatr Orthop 2025-01-14

這項研究評估了三款AI聊天機器人（ChatGPT-4.0、ChatGPT-3.5和Google Gemini）在美國骨科醫學會針對小兒肱骨上髁骨折和股骨幹骨折的建議中的準確性。結果顯示，ChatGPT-4.0和Google Gemini的準確率較高，分別為11項和9項建議。雖然所有機器人都提供了補充資訊，但修改需求各異，且可讀性方面Google Gemini表現較佳。整體而言，這些工具在小兒骨科病人教育上仍需改進。 PubMed DOI

Evaluating the Quality and Readability of Information Provided by Generative Artificial Intelligence Chatbots on Clavicle Fracture Treatment Options.
評估生成式人工智慧聊天機器人提供的鎖骨骨折治療選項資訊的質量和可讀性。 Cureus 2025-02-10

本研究評估六款生成式AI聊天機器人在鎖骨骨折管理教育中的效果，包括ChatGPT 4、Gemini 1.0等。雖然可讀性分數無顯著差異，但Microsoft Copilot和Perplexity的回答質量明顯優於其他模型。整體來看，這些AI模型在病患教育中表現良好，特別是Microsoft Copilot和Perplexity，適合用於提供鎖骨骨折相關資訊。 PubMed DOI

Evaluating Artificial Intelligence in Spinal Cord Injury Management: A Comparative Analysis of ChatGPT-4o and Google Gemini Against American College of Surgeons Best Practices Guidelines for Spine Injury.
評估人工智慧在脊髓損傷管理中的應用：ChatGPT-4o 和 Google Gemini 與美國外科醫師學會脊椎損傷最佳實踐指導方針的比較分析。 Global Spine J 2025-02-17

這項研究評估了兩個人工智慧模型，ChatGPT-4o 和 Gemini Advanced，與美國外科醫學會2022年脊椎損傷管理指導方針的一致性。研究設計了52個問題，結果顯示ChatGPT-4o的一致率為73.07%，正確回答38題；而Gemini Advanced為69.23%，正確回答36題。兩者在臨床資訊一致率均為75%。Gemini在診斷性問題上表現較佳，但ChatGPT在治療性問題上較強。整體而言，這些模型在脊椎損傷管理上顯示潛力，但仍有改進空間。 PubMed DOI

Evaluating ChatGPT's Performance in Classifying Pertrochanteric Fractures Based on Arbeitsgemeinschaft für Osteosynthesefragen/Orthopedic Trauma Association (AO/OTA) Standards.
根據 Arbeitsgemeinschaft für Osteosynthesefragen/Orthopedic Trauma Association (AO/OTA) 標準評估 ChatGPT 在分類股骨轉子骨折方面的表現。 Cureus 2025-02-28

本研究探討生成預訓練變壓器（ChatGPT）在放射影像中分類股骨轉子周圍骨折的準確性。研究結果顯示，ChatGPT能根據修訂的AO/OTA分類系統將骨折分為穩定（A1）和不穩定（A2），其分類一致性（κ = 0.420）與骨科醫生相似，顯示中等可靠性。這表明ChatGPT可有效整合進臨床工作流程，並在數據收集上需求較低，對醫療應用具潛力。 PubMed DOI

Comparing AAOS Appropriate Use Criteria with ChatGPT-4o Recommendations on Treating Distal Radius Fractures.
比較 AAOS 適當使用標準與 ChatGPT-4o 對於治療遠端橈骨骨折的建議。 Hand Surg Rehabil 2025-03-13

這項研究評估了ChatGPT-4o在遠端橈骨骨折治療適當性評分的準確性，並與美國骨科醫學會的指導方針進行比較。分析了240個病人情境，考量骨折類型、受傷機制及病人健康狀況。主要發現顯示，對於不同治療選項的評分誤差不一，掌側鎖定板的誤差最小，而背側鋼板的誤差最大。雖然某些治療方法之間有正相關，但整體上ChatGPT-4o偏向保守治療，這引發了對其在醫療建議可靠性上的疑慮。 PubMed DOI

The Challenges of Using ChatGPT for Clinical Decision Support in Orthopaedic Surgery: A Pilot Study.
使用 ChatGPT 進行骨科手術臨床決策支持的挑戰：一項初步研究。 J Am Acad Orthop Surg 2025-03-28

這項研究探討了人工智慧，特別是ChatGPT-4，在分析複雜臨床數據及生成合理評估和計畫的能力，特別針對骨科手術。研究聚焦於急診部門的十種常見骨折，利用患者的諮詢紀錄來提供AI所需的病史和檢查結果。結果顯示，ChatGPT-4能產出安全且合理的計畫，與多專科會議的臨床結果相符。雖然對大型語言模型的評估仍在發展中，但這項研究顯示AI在臨床決策中的潛力，未來可考慮以實際臨床結果作為基準。 PubMed DOI

Performance of Artificial Intelligence in Addressing Questions Regarding Management of Osteochondritis Dissecans.
人工智慧在解決有關骨軟骨壞死症管理問題上的表現。 Sports Health 2025-04-02

這項研究評估了大型語言模型（LLM）如ChatGPT和Gemini在提供骨關節軟骨壞死（OCD）資訊的表現。七位專科骨科醫生使用5點李克特量表評估兩個模型的回應，涵蓋相關性、準確性、清晰度等六個類別。結果顯示，ChatGPT在清晰度上得分最高，而Gemini在相關性和準確性上表現優異。不過，兩者在基於證據的回應上得分較低，顯示需改進。整體而言，ChatGPT表現較佳，但仍需進一步研究以確認LLMs在其他骨科疾病上的可靠性。 PubMed DOI

Advancing emergency upper extremity care: A pilot study of ChatGPT's potential role in diagnosing and managing hand and wrist trauma.
提升急診上肢照護：ChatGPT 在診斷與處理手部及腕部創傷潛在角色的初步研究 J Hand Microsurg 2025-05-12

這項研究發現，ChatGPT-4 在診斷和處理常見手部、手腕創傷時，表現和整形外科住院醫師差不多，甚至在急診處置上更優秀。AI 有潛力成為急診室醫師的好幫手，但還是建議當作輔助工具，不能完全取代專業醫師的判斷。 PubMed DOI

Performance of Artificial Intelligence in Addressing Questions Regarding the Management of Pediatric Supracondylar Humerus Fractures.
人工智慧在解答有關小兒肱骨髁上骨折處置問題的表現 J Pediatr Soc North Am 2025-05-28

這項研究比較ChatGPT和Gemini在依據2022年AAOS兒童肱骨髁上骨折指引下的表現。結果發現，兩者回答都符合指引，但Gemini在提供有根據的醫學證據上表現較佳，顯示Gemini在臨床資訊可靠度上較有潛力。不過，兩款AI各有優缺點。 PubMed DOI

原始文章

站上相關主題文章列表