ChatGPT as a Source for Patient Information on Patellofemoral Surgery-A Comparative Study Amongst Laymen, Doctors, and Experts.
ChatGPT 作為髕股關節手術患者資訊的來源 - 一項普通人、醫生與專家之間的比較研究。 Clin Pract 2024-11-25

2022年11月，OpenAI推出了ChatGPT，引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力，並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估，結果顯示專家對ChatGPT的評分普遍較低，尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯，但隨著問題複雜度增加，其表現下降，顯示出人類專業知識在醫療中的重要性。 PubMed DOI

Generative Artificial Intelligence Responses to Common Patient-Centric Hand and Wrist Surgery Questions: A Quality and Usability Analysis.
針對常見病人中心的手部和手腕手術問題的生成式人工智慧回應：質量和可用性分析。 J Hand Surg Asian Pac Vol 2025-01-08

這項研究評估了兩個AI平台（Gemini和ChatGPT）對手部和手腕手術常見問題的回答質量。共提出12個問題，分析48個回答，使用三種評分工具進行評估。結果顯示，回答的平均分數為55.7（良好）、57.2%（足夠）和4.4。手腕相關問題的回答質量顯著高於手部問題，且Gemini在評分上優於ChatGPT。雖然AI的回答通常被評為良好，但質量因平台和問題類型而異，了解這些差異對病人尋求資訊至關重要。 PubMed DOI

Use of generative large language models for patient education on common surgical conditions: a comparative analysis between ChatGPT and Google Gemini.
使用生成性大型語言模型進行常見外科病症的病患教育：ChatGPT 與 Google Gemini 的比較分析。 Updates Surg 2025-01-15

這項研究探討了可獲得的醫療資訊對患者的重要性，並評估了兩個AI工具，ChatGPT和Google Gemini，針對特定醫療狀況（如深靜脈血栓、壓瘡和痔瘡）的可理解性。結果顯示，ChatGPT的內容需要較高的教育水平才能理解，且其回應與現有線上資訊相似度較高。雖然兩者在易讀性和可靠性上有差異，但統計分析未能證明哪一個工具在資訊質量上優於另一個。 PubMed DOI

ChatGPT-4.0 vs. Google: Which Provides More Academic Answers to Patients' Questions on Arthroscopic Meniscus Repair?
ChatGPT-4.0 與 Google：哪一個對患者關於關節鏡半月板修復的問題提供更具學術性的答案？ Cureus 2025-01-27

本研究評估 ChatGPT 在回答關於關節鏡半月板修復的常見問題的有效性，並與 Google 搜尋結果進行比較。結果顯示，關於恢復時間和技術細節的問題最為常見，ChatGPT 在這些問題的回答中顯示出較高的比例。ChatGPT 的回答主要來自學術網站，而 Google 則有混合來源。結論是，ChatGPT 提供的資訊更符合學術標準，若在醫療專業人員指導下使用，可能成為患者教育的有用工具。 PubMed DOI

ChatGPT-4 Effectively Responds to Common Patient Questions on Total Ankle Arthroplasty: A Surgeon-Based Assessment of AI in Patient Education.
ChatGPT-4 有效回應關於全踝關節置換術的常見病人問題：基於外科醫生的人工智慧在病人教育中的評估。 Foot Ankle Orthop 2025-03-31

這項研究評估了ChatGPT-4在回答全踝關節置換術（TAA）相關問題的表現。研究人員提出十二個常見問題，並請四位專科外科醫生評分其回答的準確性和清晰度。平均得分為1.8（滿分4分），顯示在事實性問題上表現尚可，但對於術後方案等細緻問題評分較低。外科醫生的評分差異顯著，顯示出不同的解讀和期望。這強調了針對特定臨床情境設計AI工具的必要性，以提升病人教育和資訊的準確性。 PubMed DOI

Assessing the Usability of ChatGPT Responses Compared to Other Online Information in Hand Surgery.
評估 ChatGPT 回應的可用性與其他線上資訊在手外科中的比較。 Hand (N Y) 2025-04-12

這項研究評估了手部手術相關的線上醫療資訊，並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。主要發現包括： 1. **可讀性**：Google的回應較易讀，平均在八年級水平，而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**：ChatGPT-4的可靠性與3.5相似，但低共識主題的可讀性較低，準確性差異不大。 3. **覆蓋範圍**：ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同，但在解剖學和病理生理學上相似。總結來說，雖然ChatGPT能提供可靠的醫療資訊，但可讀性較差，醫療提供者需注意其局限性。 PubMed DOI

Dr. Chatbot: Investigating the Quality and Quantity of Responses Generated by Three AI Chatbots to Prompts Regarding Carpal Tunnel Syndrome.
Dr. Chatbot：三種 AI 聊天機器人對於腕隧道症候群相關提問之回應品質與數量的探討 Cureus 2025-04-24

這項研究比較三款AI聊天機器人回答腕隧道症候群相關問題的表現。ChatGPT-4o 回答最詳細，但 AMBOSS GPT 的答案最常被 UpToDate 證實，正確率最高。總結來說，GPT-4o 資訊多，AMBOSS GPT 則較可靠。 PubMed DOI

Is ChatGPT a More Academic Source Than Google Searches for Patients Questions About Hip Arthroscopy? An Analysis of the Most Frequently Asked Questions.
ChatGPT 是否比 Google 搜尋更具學術性：針對病患關於髖關節鏡手術最常見問題的分析 J ISAKOS 2025-05-05

這項研究比較ChatGPT和Google搜尋在回答髖關節鏡手術相關問題的表現。結果發現，兩者表現差不多，但ChatGPT提供的技術細節較多，也更常引用學術資料；Google則多引用醫療網站、醫師個人網站和政府網頁。整體來說，ChatGPT在學術參考上表現較佳。 PubMed DOI

How reliable are ChatGPT and Google's answers to frequently asked questions about unicondylar knee arthroplasty from a scientific perspective?
ChatGPT 與 Google 對於單髁膝關節置換術常見問題回答的科學可靠性如何？ J Orthop Surg (Hong Kong) 2025-06-10

這項研究發現，ChatGPT-4在單髁膝關節置換手術資訊的正確性和細節上勝過Google，但用詞較難懂，病人可能不易理解；Google雖然內容簡單易讀，但正確性和細節較不足。未來若能優化AI醫療資訊工具，將有助於提升病人教育與安全。 PubMed DOI

Assessing Accuracy of Chat Generative Pre-Trained Transformer's Responses to Common Patient Questions Regarding Congenital Upper Limb Differences.
Chat Generative Pre-Trained Transformer 回應常見先天性上肢差異患者問題之準確性評估 J Hand Surg Glob Online 2025-06-16

這項研究發現，ChatGPT-4.0在回答先天性上肢差異常見問題時，大約一半答案正確且清楚，但有8%內容不夠好或可能誤導。回答內容深度和完整性不一，且很少建議諮詢專業醫師。總結來說，ChatGPT提供的資訊大致可靠，但不夠全面或個人化，建議病人衛教時要小心使用。 PubMed DOI

原始文章

站上相關主題文章列表