Can AI Improve the Readability of Patient Education Information in Gynecology?

AI能提升婦科病患衛教資訊的可讀性嗎？

<think> 嗯，首先我要理解这个研究的目的。研究主要是想看看AI，比如大型语言模型，能不能让妇科的患者教育资料更易读。美国医学会建议患者资料应该写在六年级的水平，但现有的资料大多超过这个标准，导致患者理解困难。所以研究假设是AI可以改善这种情况。接下来，研究方法是比较三种AI模型（ChatGPT、Gemini、CoPilot）生成的资料与ACOG和UpToDate的资料。他们评估了可读性和准确性。用了八种可读性公式，还有两个妇科医生来评估准确性、清晰度和可理解性。结果显示，AI生成的资料虽然更短，但困难词汇更多。ACOG和UpToDate的资料平均在九年级和八年级六个月的水平，而AI生成的资料在十年级二个月。虽然CoPilot和Gemini在被提示后可读性有所提高，但没有一个模型能达到六年级的水平，ChatGPT反而增加了难度。所以，研究支持了部分假设，AI确实在生成更简洁的资料，但没有达到预期的可读性标准。可能是因为AI模型在简化内容时引入了更复杂的词汇，或者没有充分考虑到健康素养的需求。关于方法，使用多种可读性公式和专家评估是好的，但样本量和是否覆盖了足够的主题可能存在局限。另外，AI模型的版本和训练数据可能影响结果，不同模型的表现差异可能需要进一步研究。未来研究可能需要在AI模型中加入健康素养的守护措施，确保生成的资料不仅简洁，而且易于理解。同时，可能需要更多的测试和调整，才能让AI在临床应用中发挥更好的作用。 </think> ### 1. 研究目的與假設這項研究主要探討的是人工智慧（AI），特別是大型語言模型（LLMs），是否能改善婦科患者教育資料的可讀性。研究假設AI有潛力將患者教育資料的閱讀級別降低到美國醫學會推薦的六年級水平，以提高患者的理解度。 ### 2. 方法與設計研究採用跨-sectional設計，比較了三種LLMs（ChatGPT、Gemini、CoPilot）生成的患者教育資料與美國婦產科醫學院（ACOG）和UpToDate.com的資料。評估包括基本文本分析和使用八種可讀性公式。兩名婦產科專家評估了資料的準確性、清晰度和可理解性。ANOVA和Tukey事後測試用於比較文本分析和可讀性評分，alpha閾值設為p<.004以糾正多重比較。 ### 3. 數據解釋與結果研究結果顯示，AI生成的資料較短（平均407.9字vs. 1132.0字；p<.001），但困難詞彙比例更高（36.7%vs.27.4%；p<.001）。ACOG和UpToDate的資料分別在九年級和八年級六個月的閱讀水平，而AI生成的資料在十年級二個月（p=0.008）。CoPilot和Gemini在被提示後改善了可讀性，但無一模型達到六年級水平，ChatGPT反而增加了閱讀難度。 ### 4. 局限性與偏見研究可能的局限性包括樣本量和主題覆蓋範圍。AI模型的版本和訓練資料可能影響結果，且不同模型的表現差異需進一步研究。未考慮到的變數可能包括患者的健康素養水平和文化背景差異。 ### 5. 臨床及未來研究意涵研究表明AI在改善患者教育資料可讀性方面尚有不足，未能達到推薦的六年級閱讀水平。未來研究應聚焦於整合健康素養防護措施至AI模型，以確保生成資料在簡化的同時保持易懂性。 ### 6. 其他觀點另一個可能的解釋是AI模型在簡化內容時可能引入了更複雜的詞彙，或未充分考慮健康素養需求。此外，AI模型的演進和訓練資料的更新可能影響未來的表現，值得進一步探討。