Use of generative large language models for patient education on common surgical conditions: a comparative analysis between ChatGPT and Google Gemini.
使用生成性大型語言模型進行常見外科病症的病患教育：ChatGPT 與 Google Gemini 的比較分析。 Updates Surg 2025-01-15

這項研究探討了可獲得的醫療資訊對患者的重要性，並評估了兩個AI工具，ChatGPT和Google Gemini，針對特定醫療狀況（如深靜脈血栓、壓瘡和痔瘡）的可理解性。結果顯示，ChatGPT的內容需要較高的教育水平才能理解，且其回應與現有線上資訊相似度較高。雖然兩者在易讀性和可靠性上有差異，但統計分析未能證明哪一個工具在資訊質量上優於另一個。 PubMed DOI

Assessing the readability, quality and reliability of responses produced by ChatGPT, Gemini, and Perplexity regarding most frequently asked keywords about low back pain.
評估 ChatGPT、Gemini 和 Perplexity 對於有關下背痛的最常見關鍵字所產生的回應的可讀性、質量和可靠性。 PeerJ 2025-01-27

這項研究分析了三款AI聊天機器人（ChatGPT、Perplexity和Gemini）在低背痛相關問題上的可讀性、可靠性和回應質量。研究使用25個常見搜尋關鍵字，評估這些機器人提供的資訊是否易懂且可靠。結果顯示，所有機器人的可讀性均高於六年級水平，表示資訊難以理解。Perplexity在質量評估中表現最佳，但整體而言，這些聊天機器人的回應質量和可靠性都偏低。研究建議未來應提升AI聊天機器人的資訊清晰度與質量，以更好地幫助患者。 PubMed DOI

Evaluating the Quality and Readability of Information Provided by Generative Artificial Intelligence Chatbots on Clavicle Fracture Treatment Options.
評估生成式人工智慧聊天機器人提供的鎖骨骨折治療選項資訊的質量和可讀性。 Cureus 2025-02-10

本研究評估六款生成式AI聊天機器人在鎖骨骨折管理教育中的效果，包括ChatGPT 4、Gemini 1.0等。雖然可讀性分數無顯著差異，但Microsoft Copilot和Perplexity的回答質量明顯優於其他模型。整體來看，這些AI模型在病患教育中表現良好，特別是Microsoft Copilot和Perplexity，適合用於提供鎖骨骨折相關資訊。 PubMed DOI

Comparing ChatGPT 3.5 and 4.0 in Low Back Pain Patient Education: Addressing Strengths Limitations, and Psychosocial Challenges.
比較 ChatGPT 3.5 和 4.0 在下背痛患者教育中的應用：應對優勢、限制及心理社會挑戰。 World Neurosurg 2025-02-14

這項研究評估了AI工具，特別是ChatGPT 3.5和4.0，在提供低背痛患者教育的效果。結果顯示，ChatGPT 4.0在回應質量上明顯優於3.5，得分分別為1.03和2.07，且可靠性得分也較高。兩者在心理社會因素的問題上表現不佳，顯示出臨床醫生在這類情感敏感問題上的監督是必要的。未來發展應著重提升AI在心理社會方面的能力。 PubMed DOI

ChatGPT-3.5 and -4.0 Do Not Reliably Create Readable Patient Education Materials for Common Orthopaedic Upper- and Lower-Extremity Conditions.
ChatGPT-3.5 和 -4.0 在創建常見骨科上下肢疾病的可讀患者教育材料方面不可靠。 Arthrosc Sports Med Rehabil 2025-03-05

這項研究評估了ChatGPT-3.5和ChatGPT-4.0在生成病人教育材料的效果，針對常見的上肢和下肢骨科疾病進行分析。結果顯示，ChatGPT-3.5的可讀性僅有2%和4%達標，而ChatGPT-4.0則有54%達標，顯示出明顯的進步。雖然ChatGPT-4.0在可讀性上表現優異，但兩者仍被視為不可靠，無法完全取代傳統病人教育方式，應作為醫療提供者的輔助工具。 PubMed DOI

Readability of Orthopaedic Patient Educational Material: An artificial intelligence application.
骨科病患教育材料的可讀性：一項人工智慧應用。 J Clin Orthop Trauma 2025-04-14

這項研究探討人工智慧（AI）在簡化骨科創傷病患教育材料的有效性。分析了35篇來自第1級創傷中心的文章，並使用Python程式評估其可讀性。經過四次GPT AI模型改寫後，所有模型成功降低了文章的閱讀年級水平，特別是GPT-4o-Mini和GPT-4o表現最佳，而GPT-3.5-Turbo效果較差。成本分析顯示，GPT-4o每篇文章費用為0.61美元，雖然較貴，但準確性高。研究結論認為，AI能有效簡化病患教育材料，且保持準確性。 PubMed DOI

The role of large language models in improving the readability of orthopaedic spine patient educational material.
大型語言模型在提升骨科脊椎病患衛教資料可讀性上的角色 J Orthop Surg Res 2025-05-28

多數骨科衛教資料太難懂，超過國小六年級程度，讓病患難以理解。這項研究用ChatGPT、Gemini和CoPilot三種AI，簡化美國骨科醫學會網站上的脊椎文章。結果發現，AI能大幅提升文章易讀性，內容正確性也沒變。ChatGPT最能提升易讀性，Gemini則擅長補充免責聲明。這顯示AI有助於讓醫療資訊更親民，促進病患教育與健康平等。 PubMed DOI

Evaluating DeepResearch and DeepThink in anterior cruciate ligament surgery patient education: ChatGPT-4o excels in comprehensiveness, DeepSeek R1 leads in clarity and readability of orthopaedic information.
在前十字韌帶手術病患衛教中評估 DeepResearch 與 DeepThink：ChatGPT-4o 於全面性表現優異，DeepSeek R1 在骨科資訊的清晰度與可讀性方面領先 Knee Surg Sports Traumatol Arthrosc 2025-06-01

這項研究比較 ChatGPT-4o 和 DeepSeek R1 回答 ACL 手術常見問題的表現。結果顯示，兩者答案都很正確且一致。ChatGPT 的內容較完整，DeepSeek 則更清楚、好讀，對一般人來說較容易理解。整體來說，兩款 AI 都能提供高品質資訊，若能結合兩者優點，將更有助於病人衛教。 PubMed DOI

Evaluating Artificial Intelligence in Patient Education: DeepSeek-V3 Versus ChatGPT-4o in Answering Common Questions on Laparoscopic Cholecystectomy.
人工智慧於病患衛教中的評估：DeepSeek-V3 與 ChatGPT-4o 在回答腹腔鏡膽囊切除術常見問題之比較 ANZ J Surg 2025-06-11

這項研究比較DeepSeek-V3和ChatGPT-4o在回答腹腔鏡膽囊切除術常見病人問題的表現。由兩位外科醫師評分後，發現DeepSeek-V3在適切性、正確性和易讀性都勝出，顯示它在這類病人衛教上可能更有優勢。 PubMed DOI

Bridging Health Literacy Gaps in Spine Care: Using ChatGPT-4o to Improve Patient-Education Materials.
彌補脊椎照護健康素養差距：運用 ChatGPT-4o 改善病患衛教資料 J Bone Joint Surg Am 2025-06-19

許多脊椎相關的病患衛教資料，閱讀難度太高，超過多數人能理解的程度。研究發現，這些資料平均要有美國高中二年級程度才能看懂，遠高於建議的國中一年級水準。用 ChatGPT-4o 重寫後，內容變得更簡單易懂，資訊也沒跑掉。AI 工具確實能幫助醫療資訊更親民，但未來還要加上圖像和更友善的呈現方式，才能照顧到所有病患。 PubMed DOI

原始文章

站上相關主題文章列表