Evidence-Based Potential of Generative Artificial Intelligence Large Language Models on Dental Avulsion: ChatGPT Versus Gemini.
基於證據的生成式人工智慧大型語言模型在牙齒脫落中的潛力：ChatGPT 與 Gemini 的比較。 Dent Traumatol 2024-11-02

這項研究比較了ChatGPT和Gemini兩個AI語言模型在牙齒脫位問題上的回答準確性。研究使用了33個問題，並由四位小兒牙醫評估回答。結果顯示，Gemini的平均得分顯著高於ChatGPT（p = 0.001）。雖然ChatGPT在開放式問題和是非題上表現較好，但在選擇題上不佳。整體來看，Gemini的回答更準確（p = 0.004）。這些結果顯示兩個模型在牙科領域有潛力，但仍需進一步研究和改進。 PubMed DOI

Generative Artificial Intelligence Responses to Common Patient-Centric Hand and Wrist Surgery Questions: A Quality and Usability Analysis.
針對常見病人中心的手部和手腕手術問題的生成式人工智慧回應：質量和可用性分析。 J Hand Surg Asian Pac Vol 2025-01-08

這項研究評估了兩個AI平台（Gemini和ChatGPT）對手部和手腕手術常見問題的回答質量。共提出12個問題，分析48個回答，使用三種評分工具進行評估。結果顯示，回答的平均分數為55.7（良好）、57.2%（足夠）和4.4。手腕相關問題的回答質量顯著高於手部問題，且Gemini在評分上優於ChatGPT。雖然AI的回答通常被評為良好，但質量因平台和問題類型而異，了解這些差異對病人尋求資訊至關重要。 PubMed DOI

Pediatric Supracondylar Humerus and Diaphyseal Femur Fractures: A Comparative Analysis of Chat Generative Pretrained Transformer and Google Gemini Recommendations Versus American Academy of Orthopaedic Surgeons Clinical Practice Guidelines.
小兒肱骨上髁骨折與股骨幹骨折：Chat Generative Pretrained Transformer 和 Google Gemini 建議與美國骨科醫學會臨床實踐指導方針的比較分析。 J Pediatr Orthop 2025-01-14

這項研究評估了三款AI聊天機器人（ChatGPT-4.0、ChatGPT-3.5和Google Gemini）在美國骨科醫學會針對小兒肱骨上髁骨折和股骨幹骨折的建議中的準確性。結果顯示，ChatGPT-4.0和Google Gemini的準確率較高，分別為11項和9項建議。雖然所有機器人都提供了補充資訊，但修改需求各異，且可讀性方面Google Gemini表現較佳。整體而言，這些工具在小兒骨科病人教育上仍需改進。 PubMed DOI

Assessing ChatGPT Responses to Frequently Asked Questions Regarding Pediatric Supracondylar Humerus Fractures.
評估 ChatGPT 對於小兒肱骨上髁骨折常見問題的回答。 J Pediatr Orthop 2025-02-07

這項研究評估了ChatGPT在回答小兒肱骨上髁骨折相關問題的效果。研究中提出七個常見問題，並根據回答的清晰度和準確性進行分類。結果顯示，四個回答雖然滿意，但仍需澄清；三個則不滿意，缺乏準確性和清晰度。沒有任何回答被評為優秀。研究指出，ChatGPT提供的資訊雖有幫助，但通常需要進一步澄清，特別是在治療方案上。因此，建議家長應諮詢醫療專業人員以獲得準確指導。這項評估屬於五級專家意見。 PubMed DOI

Evaluating the Quality and Readability of Information Provided by Generative Artificial Intelligence Chatbots on Clavicle Fracture Treatment Options.
評估生成式人工智慧聊天機器人提供的鎖骨骨折治療選項資訊的質量和可讀性。 Cureus 2025-02-10

本研究評估六款生成式AI聊天機器人在鎖骨骨折管理教育中的效果，包括ChatGPT 4、Gemini 1.0等。雖然可讀性分數無顯著差異，但Microsoft Copilot和Perplexity的回答質量明顯優於其他模型。整體來看，這些AI模型在病患教育中表現良好，特別是Microsoft Copilot和Perplexity，適合用於提供鎖骨骨折相關資訊。 PubMed DOI

Evaluating Artificial Intelligence in Spinal Cord Injury Management: A Comparative Analysis of ChatGPT-4o and Google Gemini Against American College of Surgeons Best Practices Guidelines for Spine Injury.
評估人工智慧在脊髓損傷管理中的應用：ChatGPT-4o 和 Google Gemini 與美國外科醫師學會脊椎損傷最佳實踐指導方針的比較分析。 Global Spine J 2025-02-17

這項研究評估了兩個人工智慧模型，ChatGPT-4o 和 Gemini Advanced，與美國外科醫學會2022年脊椎損傷管理指導方針的一致性。研究設計了52個問題，結果顯示ChatGPT-4o的一致率為73.07%，正確回答38題；而Gemini Advanced為69.23%，正確回答36題。兩者在臨床資訊一致率均為75%。Gemini在診斷性問題上表現較佳，但ChatGPT在治療性問題上較強。整體而言，這些模型在脊椎損傷管理上顯示潛力，但仍有改進空間。 PubMed DOI

Breaking Bones, Breaking Barriers: ChatGPT, DeepSeek, and Gemini in Hand Fracture Management.
打破骨頭，打破障礙：ChatGPT、DeepSeek 和 Gemini 在手部骨折管理中的應用。 J Clin Med 2025-03-27

這項研究評估了三個人工智慧模型—ChatGPT-4o、DeepSeek-V3 和 Gemini 1.5—在手部骨折診斷與治療建議的有效性，並與經驗豐富的外科醫生進行比較。結果顯示，ChatGPT-4o的準確率最高，但精確度較低；DeepSeek-V3表現中等，偶爾漏掉正確方案；而Gemini 1.5則表現不佳。結論指出，雖然AI能增強臨床流程，但在複雜案例中仍無法取代人類專業，且需解決倫理問題才能廣泛應用。 PubMed DOI

Performance of Artificial Intelligence in Addressing Questions Regarding Management of Osteochondritis Dissecans.
人工智慧在解決有關骨軟骨壞死症管理問題上的表現。 Sports Health 2025-04-02

這項研究評估了大型語言模型（LLM）如ChatGPT和Gemini在提供骨關節軟骨壞死（OCD）資訊的表現。七位專科骨科醫生使用5點李克特量表評估兩個模型的回應，涵蓋相關性、準確性、清晰度等六個類別。結果顯示，ChatGPT在清晰度上得分最高，而Gemini在相關性和準確性上表現優異。不過，兩者在基於證據的回應上得分較低，顯示需改進。整體而言，ChatGPT表現較佳，但仍需進一步研究以確認LLMs在其他骨科疾病上的可靠性。 PubMed DOI

ChatGPT and Google Gemini are Clinically Inadequate in Providing Recommendations on Management of Developmental Dysplasia of the Hip Compared to American Academy of Orthopaedic Surgeons Clinical Practice Guidelines.
ChatGPT 與 Google Gemini 在發育性髖關節發育不良（Developmental Dysplasia of the Hip）管理建議上，與美國骨科醫學會臨床指引相比，臨床表現不足 J Pediatr Soc North Am 2025-05-28

這項研究比較ChatGPT-4.0、ChatGPT-3.5和Google Gemini在回答DDH醫學問題時的表現。結果發現，三款AI的答案準確性都有限，常常有錯誤或遺漏重點。雖然準確度差不多，但Google Gemini的內容最容易閱讀。建議醫師要提醒病患，AI醫療資訊還有很多限制，不能完全依賴。 PubMed DOI

AI Chatbots in Pediatric Orthopedics: How Accurate Are Their Answers to Parents' Questions on Bowlegs and Knock Knees?
兒童骨科中的 AI 聊天機器人：它們對家長關於 O 型腿與 X 型腿問題的回答有多準確？ Healthcare (Basel) 2025-06-13

這項研究比較了三款AI聊天機器人回答兒童O型腿和X型腿問題的表現。結果發現，ChatGPT和Gemini的答案比Copilot更正確、內容也更完整，但三者在表達清楚度和錯誤資訊風險上差不多。整體來說，AI可以協助提供健康資訊，但在兒科醫療領域，專家審核還是很重要。 PubMed DOI

原始文章

站上相關主題文章列表