Use of generative large language models for patient education on common surgical conditions: a comparative analysis between ChatGPT and Google Gemini.
使用生成性大型語言模型進行常見外科病症的病患教育：ChatGPT 與 Google Gemini 的比較分析。 Updates Surg 2025-01-15

這項研究探討了可獲得的醫療資訊對患者的重要性，並評估了兩個AI工具，ChatGPT和Google Gemini，針對特定醫療狀況（如深靜脈血栓、壓瘡和痔瘡）的可理解性。結果顯示，ChatGPT的內容需要較高的教育水平才能理解，且其回應與現有線上資訊相似度較高。雖然兩者在易讀性和可靠性上有差異，但統計分析未能證明哪一個工具在資訊質量上優於另一個。 PubMed DOI

Application of ChatGPT as a content generation tool in continuing medical education: acne as a test topic.
ChatGPT 在持續醫學教育中的內容生成工具應用：以痤瘡為測試主題。 Dermatol Reports 2025-02-19

AICHECK的研究評估了ChatGPT在生成持續醫學教育內容的有效性，特別針對痤瘡的回應與NICE指導方針進行比較。研究使用23項問卷，由五位皮膚科醫生評估ChatGPT版本4的輸出。結果顯示質量、可讀性和全面性評分高，但準確性和與指導方針的一致性較低。雖然參考文獻的相關性和適切性獲得好評，但僅62.3%被認為是最新的。研究強調對於有爭議的主題，AI生成內容需嚴格評估和專家監督，以確保準確性。 PubMed DOI

Leveraging ChatGPT to Produce Patient Education Materials for Common Hand Conditions.
利用 ChatGPT 製作常見手部疾病的病患教育材料。 J Hand Surg Glob Online 2025-02-24

這項研究評估了ChatGPT 3.5和4.0生成的病人教育材料（PEMs）在可讀性上的表現，針對常見手部疾病進行分析。研究發現，ChatGPT 4.0在啟發階段後，有28%的內容達到六年級閱讀水平，而3.5則沒有生成合適的內容。整體來看，4.0在所有可讀性指標上均優於3.5，顯示出其在提升病人教育和健康素養方面的潛力，未來隨著進一步改進，這一潛力將更為明顯。 PubMed DOI

ChatGPT-3.5 and -4.0 Do Not Reliably Create Readable Patient Education Materials for Common Orthopaedic Upper- and Lower-Extremity Conditions.
ChatGPT-3.5 和 -4.0 在創建常見骨科上下肢疾病的可讀患者教育材料方面不可靠。 Arthrosc Sports Med Rehabil 2025-03-05

這項研究評估了ChatGPT-3.5和ChatGPT-4.0在生成病人教育材料的效果，針對常見的上肢和下肢骨科疾病進行分析。結果顯示，ChatGPT-3.5的可讀性僅有2%和4%達標，而ChatGPT-4.0則有54%達標，顯示出明顯的進步。雖然ChatGPT-4.0在可讀性上表現優異，但兩者仍被視為不可靠，無法完全取代傳統病人教育方式，應作為醫療提供者的輔助工具。 PubMed DOI

Improving Readability of Shoulder and Elbow Surgery Online Patient Education Material with Chat Generative Pretrained Transformer (ChatGPT) 4.
利用 Chat Generative Pretrained Transformer (ChatGPT) 4 改善肩膀和肘部手術線上病患教育材料的可讀性。 J Shoulder Elbow Surg 2025-03-21

健康素養對醫生與病人溝通非常重要，特別是手術病人需要理解複雜的程序。美國醫學會建議病人教育材料應以六到八年級的閱讀水平撰寫，但許多線上資源卻較難懂。研究人員分析了三十段有關肩膀和肘部手術的資訊，發現原始文本的可讀性達到十年級。使用ChatGPT-4簡化後，文本可讀性顯著提高，降至八年級水平。這顯示AI能有效簡化醫療資訊，但仍需人類審查以確保準確性。 PubMed DOI

Evaluating ChatGPT for converting clinic letters into patient-friendly language.
評估 ChatGPT 將診所信件轉換為患者友好語言的能力。 BJGP Open 2025-03-31

這項研究探討了使用ChatGPT將臨床信件翻譯成更易懂的語言，目的是增強患者對治療和診斷的理解。研究採用單盲定量方法，分析語言複雜度的指標。翻譯了二十三封來自不同專科的診所信件，結果顯示翻譯保留了臨床信息，並顯著提升了患者的理解與滿意度。患者尋求醫療協助解釋信件的需求也明顯減少。結論認為，ChatGPT是一個有效的工具，能創造更友好的臨床信件版本，讓患者更容易理解。 PubMed DOI

Online patient information on labour epidural analgesia provided by UK NHS hospitals: assessment of readability and improvement of readability standards using ChatGPT.
英國 NHS 醫院提供的勞動硬膜外鎮痛的在線病人資訊：可讀性評估及使用 ChatGPT 改善可讀性標準。 Int J Obstet Anesth 2025-04-02

分娩硬膜外麻醉是緩解產痛的首選，但病人教育材料的有效性受健康素養影響。本研究評估英國公立醫院的線上資源可讀性，並探討像ChatGPT的人工智慧是否能改善清晰度。結果顯示，61.6%的醫院提供相關資料，但只有14.5%和23.2%符合可讀性標準，平均可讀性等級為8.4，超過建議的六年級水平。使用ChatGPT重寫後，符合標準的比例提升至24.6%和27.5%，平均等級降至7.7，顯示改善，但仍未達理想的健康素養標準。 PubMed DOI

Assessing the Usability of ChatGPT Responses Compared to Other Online Information in Hand Surgery.
評估 ChatGPT 回應的可用性與其他線上資訊在手外科中的比較。 Hand (N Y) 2025-04-12

這項研究評估了手部手術相關的線上醫療資訊，並比較了Google、ChatGPT-3.5和ChatGPT-4.0的回應。研究針對腕隧道症候群、網球肘和富血小板血漿用於拇指關節炎三個問題進行分析。主要發現包括： 1. **可讀性**：Google的回應較易讀，平均在八年級水平，而ChatGPT則在大學二年級水平。低共識主題的可讀性普遍較差。 2. **可靠性與準確性**：ChatGPT-4的可靠性與3.5相似，但低共識主題的可讀性較低，準確性差異不大。 3. **覆蓋範圍**：ChatGPT-4和Google在疾病原因和程序細節的覆蓋上有所不同，但在解剖學和病理生理學上相似。總結來說，雖然ChatGPT能提供可靠的醫療資訊，但可讀性較差，醫療提供者需注意其局限性。 PubMed DOI

Improving Accessibility to Facial Plastic and Reconstructive Surgery Patient Resources Using Artificial Intelligence: A Pilot Study in Patient Education Materials.
運用人工智慧提升臉部整形與重建手術病患資源的可近性：病患衛教資料的初步研究 Facial Plast Surg Aesthet Med 2025-04-17

這項研究發現，AI工具（如ChatGPT、Copilot、Gemini）能把顏面整形衛教資料改寫得更容易閱讀，雖然還沒達到理想的國中一年級水準。有醫師把關下，用AI簡化衛教內容，有助於讓病患更容易取得和理解健康資訊。 PubMed DOI

Improving Patient Communication by Simplifying AI-Generated Dental Radiology Reports With ChatGPT: Comparative Study.
利用 ChatGPT 簡化 AI 生成牙科放射線報告以提升病患溝通：比較性研究 J Med Internet Res 2025-06-09

這項研究發現，用ChatGPT簡化放射科報告後，病人更容易看懂內容，覺得資訊更清楚、語氣更親切，也更有信心和醫師討論、參與決策。AI工具有助於讓醫療資訊更貼近病人需求，但還需要更多研究來確保所有人都適用且正確。 PubMed DOI

原始文章

站上相關主題文章列表