ChatGPT as a Source for Patient Information on Patellofemoral Surgery-A Comparative Study Amongst Laymen, Doctors, and Experts.
ChatGPT 作為髕股關節手術患者資訊的來源 - 一項普通人、醫生與專家之間的比較研究。 Clin Pract 2024-11-25

2022年11月，OpenAI推出了ChatGPT，引發了對其在醫學領域有效性的討論。研究專注於ChatGPT對髕股疼痛的回答能力，並比較一般民眾、非骨科醫生及專家的評價。使用12個問題進行評估，結果顯示專家對ChatGPT的評分普遍較低，尤其在複雜問題上。雖然ChatGPT提供的資訊質量不錯，但隨著問題複雜度增加，其表現下降，顯示出人類專業知識在醫療中的重要性。 PubMed DOI

ChatGPT is a comprehensive education tool for patients with patellar tendinopathy, but it currently lacks accuracy and readability.
ChatGPT 是一個針對髕腱病患者的綜合教育工具，但目前在準確性和可讀性方面存在不足。 Musculoskelet Sci Pract 2025-02-03

生成式 AI 工具如 ChatGPT 在醫療查詢中越來越受歡迎，特別是在解答髕腱病相關問題上。一項研究評估了 ChatGPT-4 的表現，收集了 48 個問題並由專家評估其回應。結果顯示，只有 33% 的回應準確，但 75% 是全面的。治療相關問題的準確率僅 17%。回應的可讀性達到大學水平，且可理解性良好（83%），但可行性較低（60%）。總體而言，ChatGPT-4 提供了豐富資訊，但準確性不足，且對於低學歷者不易理解。 PubMed DOI

Comparing ChatGPT 3.5 and 4.0 in Low Back Pain Patient Education: Addressing Strengths Limitations, and Psychosocial Challenges.
比較 ChatGPT 3.5 和 4.0 在下背痛患者教育中的應用：應對優勢、限制及心理社會挑戰。 World Neurosurg 2025-02-14

這項研究評估了AI工具，特別是ChatGPT 3.5和4.0，在提供低背痛患者教育的效果。結果顯示，ChatGPT 4.0在回應質量上明顯優於3.5，得分分別為1.03和2.07，且可靠性得分也較高。兩者在心理社會因素的問題上表現不佳，顯示出臨床醫生在這類情感敏感問題上的監督是必要的。未來發展應著重提升AI在心理社會方面的能力。 PubMed DOI

Reliability, Accuracy, and Comprehensibility of AI-Based Responses to Common Patient Questions Regarding Spinal Cord Stimulation.
基於人工智慧的回應對於脊髓刺激常見病人問題的可靠性、準確性及可理解性。 J Clin Med 2025-03-17

脊髓刺激（SCS）是一種有效的慢性疼痛治療方法，但患者常有疑問。本研究探討ChatGPT對SCS常見問題的回答在可靠性、準確性和可理解性方面的表現。研究選擇了十三個問題，並由專業醫師和非醫療人士評估。結果顯示，ChatGPT的回答在可靠性和可理解性上表現良好，準確性也達到95%。總結來說，ChatGPT可作為患者教育SCS的輔助工具，尤其在一般性問題上，但對於技術性問題則可能較為困難。 PubMed DOI

Readability, reliability and quality of responses generated by ChatGPT, gemini, and perplexity for the most frequently asked questions about pain.
ChatGPT、Gemini 和 Perplexity 對於最常見的疼痛相關問題所生成的回答的可讀性、可靠性和質量。 Medicine (Baltimore) 2025-03-18

這項研究調查了三款AI聊天機器人—ChatGPT、Gemini和Perplexity—在回答有關疼痛的常見問題時的可讀性、可靠性和回應質量。全球超過30%的人口面臨慢性疼痛，許多人會在就醫前尋找健康資訊。研究發現，這三款聊天機器人的可讀性均超過六年級水平，其中Gemini最佳。質量方面，Gemini得分較高，而Perplexity在可靠性評估中表現較好。總體來說，這些聊天機器人的回應難以閱讀，且可靠性和質量較低，無法取代專業醫療諮詢，建議改善可讀性並加強專家監督。 PubMed DOI

Effectiveness of Generative Artificial Intelligence-Driven Responses to Patient Concerns in Long-Term Opioid Therapy: Cross-Model Assessment.
長期鴉片類藥物治療中生成式人工智慧驅動的患者關注回應的有效性：跨模型評估。 Biomedicines 2025-03-28

本研究探討了ChatGPT在長期鴉片類藥物治療中對患者教育的潛力。專家小組選定十三個常見問題，並讓GPT-4.0模擬醫生回答。結果顯示，ChatGPT的回答在可靠性和可理解性上表現良好，但準確性中等，尤其在耐受性和依賴管理等技術性問題上較弱。這顯示出AI工具在患者教育中的輔助價值，但也強調了持續改進和專業訓練的必要性，醫療專業人士與AI開發者的合作對於提升教育質量至關重要。 PubMed DOI

Evaluating Large Language Models in Addressing Patient Questions on Endodontic Pain: A Comparative Analysis of accessible chatbots.
可及性聊天機器人在回應病患牙髓疼痛問題之表現評估：大型語言模型的比較分析 J Endod 2025-05-07

這項研究發現，ChatGPT 3.5回答牙髓病痛問題時，內容較完整可靠，但用詞偏難懂；Gemini則較易讀，但資訊不夠完整、可靠性較低。總結來說，AI雖能輔助衛教，仍需專業人員把關，確保資訊正確又好懂。 PubMed DOI

Information about labor epidural analgesia: an updated evaluation on the readability, accuracy, and quality of ChatGPT responses incorporating patient preferences and complex clinical scenarios.
有關分娩硬膜外止痛的資訊：結合病人偏好與複雜臨床情境，對 ChatGPT 回應的可讀性、正確性與品質的最新評估 Int J Obstet Anesth 2025-05-25

這項研究發現，ChatGPT-4o能正確回答分娩硬膜外止痛相關問題，內容也很實用易懂，但用詞偏艱深，約高中到大學程度。雖然它能提供可靠資訊，但建議優化提問方式，讓回答更貼近病人、方便理解。 PubMed DOI

Comparison of quality, empathy and readability of physician responses versus chatbot responses to common cerebrovascular neurosurgical questions on a social media platform.
醫師回覆與聊天機器人回覆於社群媒體平台上對常見腦血管神經外科問題之品質、同理心與可讀性比較 Clin Neurol Neurosurg 2025-06-01

這項初步研究發現，ChatGPT 3.5回答腦血管問題時，比醫師更完整、有同理心，正確率也差不多，但用詞較艱深，一般人可能看不懂。未來可考慮結合AI和醫師意見，幫助病患更好溝通。 PubMed DOI

Comparative Efficacy of ChatGPT and DeepSeek in Addressing Patient Queries on Gonarthrosis and Total Knee Arthroplasty.
ChatGPT 與 DeepSeek 在回應關於膝關節炎（Gonarthrosis）及全膝關節置換術（Total Knee Arthroplasty）病患問題之效能比較 Arthroplast Today 2025-06-16

這項研究發現，ChatGPT在解釋膝關節置換手術及術後照護時，比DeepSeek更準確、讓人更滿意。不論病人還是骨科醫師，都比較推薦ChatGPT。顯示ChatGPT有機會成為病人衛教和減輕手術焦慮的好幫手。未來可再研究AI怎麼融入臨床，對治療結果有什麼影響。 PubMed DOI

原始文章

站上相關主題文章列表