Can Artificial Intelligence Improve the Readability of Patient Education Materials on Aortic Stenosis? A Pilot Study.
人工智慧是否能改善主動脈瓣狹窄患者教育資料的易讀性？一項初步研究。 Cardiol Ther 2024-03-01

生成式人工智慧對話平台和大型語言模型可幫助提升健康知識，重新編寫患者教育資料，如主動脈瓣狹窄，讓患者更容易理解。兩個AI平台成功提升了資料的易讀性，但並非總是達到建議的小學六年級閱讀水準。在改善易讀性和轉換時間方面，ChatGPT-3.5比Bard效果更好。AI工具有潛力未來提升心臟健康知識。 PubMed DOI

Generative Artificial Intelligence in Patient Education: ChatGPT Takes on Hypertension Questions.
生成式人工智慧在患者教育中的應用：ChatGPT應對高血壓問題。 Cureus 2024-03-05

高血壓若控制不當，可能導致嚴重健康問題。許多人難以保持正常血壓。網路醫療資訊需區分真假。生成式人工智慧（GeAI）在健康資訊上廣泛應用，但需注意錯誤資訊。研究發現ChatGPT在高血壓資訊中92.5%準確，可信度達93%。GeAI潛力大，但仍需進一步研究確保醫療可靠性。 PubMed DOI

Leveraging ChatGPT to aid patient education on coronary angiogram.
利用 ChatGPT 協助病患了解冠狀動脈造影檢查。 Ann Acad Med Singap 2024-06-21

ChatGPT等自然語言AI有潛力改變醫療服務。我們評估了ChatGPT提供冠狀動脈造影相關資訊的能力，並探討了利用AI進行患者教育的機會與挑戰。ChatGPT通常提供全面資訊，但也有不準確和有限之處。雖AI可成為患者寶貴資源，但無法取代專業人員提供的個人化醫療建議。 PubMed DOI

Performance of AI-powered chatbots in diagnosing acute pulmonary thromboembolism from given clinical vignettes.
AI 驅動聊天機器人在從臨床案例診斷急性肺栓塞的表現。 Acute Med 2024-08-12

這項研究評估了聊天機器人在診斷肺栓塞（PE）及其嚴重性評估的準確性。分析了65份病例報告，結果顯示Bard和Bing的準確率為92.3%，ChatGPT-3.5為87.6%。在首要診斷中，Bard的準確率為56.9%，ChatGPT為47.7%，Bing則為30.8%。雖然這些聊天機器人在識別大規模PE方面表現良好，但也有過度分類的問題。儘管如此，它們仍可作為臨床決策的輔助工具，未來需進一步研究以提升其在實際臨床中的表現。 PubMed DOI

Leveraging Generative Artificial Intelligence Models in Patient Education on Inferior Vena Cava Filters.
利用生成式人工智慧模型進行下腔靜脈濾器的病患教育。 Clin Pract 2024-08-28

本研究探討了由生成式人工智慧（AI）模型產生的下腔靜脈（IVC）濾器患者教育材料的可讀性。結果顯示，Microsoft Copilot生成的材料可讀性較高，Gunning Fog分數為11.58，明顯優於ChatGPT的17.76。雖然兩者的Flesch-Kincaid分數都未達到美國建議的閱讀水平，但Copilot的材料更易於理解，顯示出在患者教育上有更好的應用潛力。 PubMed DOI

Radiologic Decision-Making for Imaging in Pulmonary Embolism: Accuracy and Reliability of Large Language Models-Bing, Claude, ChatGPT, and Perplexity.
肺栓塞影像學的放射學決策：大型語言模型-Bing、Claude、ChatGPT 和 Perplexity 的準確性與可靠性。 Indian J Radiol Imaging 2024-09-25

本研究探討四種大型語言模型（LLMs）在肺栓塞影像學決策支持的準確性，包括Microsoft Bing、Claude、ChatGPT 3.5和Perplexity。結果顯示，Perplexity在開放式問題中表現最佳（0.83），而Bing在選擇所有適用項目問題中得分最高（0.96）。整體而言，開放式問題的表現優於選擇題。研究強調，LLMs的準確性不一致，需進一步改進，並指出放射科醫生在臨床決策中仍需謹慎選擇和調整。 PubMed DOI

An Observational Study to Evaluate Readability and Reliability of AI-Generated Brochures for Emergency Medical Conditions.
一項觀察性研究以評估人工智慧生成的急救醫療條件手冊的可讀性和可靠性。 Cureus 2024-10-01

本研究評估了ChatGPT與Google Gemini生成的急救醫療手冊在可讀性和可靠性上的差異。結果顯示，兩者在字數、句子數、可讀性及可靠性上並無顯著差異，但ChatGPT的內容較為詳細，字數多32.4%。雖然Gemini的可讀性稍高，但在特定主題上，兩者的表現各有優劣。研究強調需針對特定主題進行深入評估，以提升病患資訊的質量。 PubMed DOI

Empowering patients: how accurate and readable are large language models in renal cancer education.
賦能患者：大型語言模型在腎癌教育中的準確性和可讀性如何。 Front Oncol 2024-10-12

人工智慧（AI）在醫療領域的應用，特別是針對腎癌的病人教育材料（PEMs），帶來了顯著變化。本研究比較了ChatGPT 4.0、Gemini AI和Perplexity AI生成的資訊準確性與可讀性，並與美國泌尿學會（AUA）和歐洲泌尿學會（EAU）的PEMs進行對照。結果顯示，AUA的PEM可讀性最佳，AI生成的內容雖然準確，但在治療資訊上有些小遺漏。雖然AI能簡化內容，但在病人教育中使用時仍需謹慎，以免造成誤解。 PubMed DOI

Use of generative large language models for patient education on common surgical conditions: a comparative analysis between ChatGPT and Google Gemini.
使用生成性大型語言模型進行常見外科病症的病患教育：ChatGPT 與 Google Gemini 的比較分析。 Updates Surg 2025-01-15

這項研究探討了可獲得的醫療資訊對患者的重要性，並評估了兩個AI工具，ChatGPT和Google Gemini，針對特定醫療狀況（如深靜脈血栓、壓瘡和痔瘡）的可理解性。結果顯示，ChatGPT的內容需要較高的教育水平才能理解，且其回應與現有線上資訊相似度較高。雖然兩者在易讀性和可靠性上有差異，但統計分析未能證明哪一個工具在資訊質量上優於另一個。 PubMed DOI

Artificial intelligence in healthcare education: evaluating the accuracy of ChatGPT, Copilot, and Google Gemini in cardiovascular pharmacology.
醫療教育中的人工智慧：評估 ChatGPT、Copilot 和 Google Gemini 在心血管藥理學中的準確性。 Front Med (Lausanne) 2025-03-06

這項研究分析了三種生成式人工智慧工具—ChatGPT-4、Copilot 和 Google Gemini—在心血管藥理學問題上的表現。研究使用了45道多選題和30道短答題，並由專家評估AI生成的答案準確性。結果顯示，這三種AI在簡單和中等難度的多選題上表現良好，但在高難度題目上表現不佳，特別是Gemini。ChatGPT-4在所有題型中表現最佳，Copilot次之，而Gemini則需改進。這些結果顯示AI在醫學教育中的潛力與挑戰。 PubMed DOI

原始文章

站上相關主題文章列表