Can Large Language Models Aid Caregivers of Pediatric Cancer Patients in Information Seeking? A Cross-Sectional Investigation.
大型語言模型能否協助兒童癌症患者的照顧者進行資訊搜尋？一項橫斷面研究。 Cancer Med 2025-01-08

這項研究評估了四種大型語言模型（LLM）工具——ChatGPT、Google Bard、Microsoft Bing Chat 和 Google SGE——在提供癌症兒童照顧者資訊的有效性。研究使用26個常見問題，五位小兒腫瘤學專家根據多項標準進行評估。結果顯示，ChatGPT整體表現最佳，特別在複雜性上，而Google Bard在準確性和清晰度上表現突出。Bing Chat和Google SGE得分較低。專家強調情感語調和同理心的重要性，未來需進一步研究這些工具在其他醫療領域的應用。 PubMed DOI

Evaluating AI Chatbot Responses to Postkidney Transplant Inquiries.
評估 AI 聊天機器人對腎臟移植後詢問的回應。 Transplant Proc 2025-01-15

這項研究評估了三款AI聊天機器人—ChatGPT 4.0、Claude 3.0和Gemini Pro—以及Google在回答腎臟移植後常見問題的表現。研究使用5點李克特量表評估回應質量，並透過病人教育材料評估工具（PEMAT）檢視可理解性和可行性。結果顯示，回應質量高（中位分數4），可理解性良好（中位72.7%），但可行性較差（中位20%）。可讀性較難，Claude 3.0提供最可靠的回應，而ChatGPT 4.0則在可理解性上表現突出。Google在各項指標上未能超越這些聊天機器人。 PubMed DOI

Efficacy and empathy of AI chatbots in answering frequently asked questions on oral oncology.
AI 聊天機器人在回答口腔腫瘤學常見問題的效能與同理心。 Oral Surg Oral Med Oral Pathol Oral Radiol 2025-01-22

這項研究評估了五款AI聊天機器人對口腔癌問題的回應，包括Bing、GPT-3.5、GPT-4、Google Bard和Claude。經過專家評估，GPT-4獲得最高質量分數（17.3），而Bing最低（14.9）。Bard在可讀性上表現最佳，GPT-4和Bard在同理心及引用準確性方面也表現突出。整體來看，GPT-4提供的回應質量最高，但大多數聊天機器人在同理心和準確引用上仍有待加強。 PubMed DOI

A Comparison of Prostate Cancer Screening Information Quality on Standard and Advanced Versions of ChatGPT, Google Gemini, and Microsoft Copilot: A Cross-Sectional Study.
標準版與進階版 ChatGPT、Google Gemini 和 Microsoft Copilot 在前列腺癌篩檢資訊品質的比較：一項橫斷面研究。 Am J Health Promot 2025-01-24

這項研究評估了多款AI聊天機器人在提供前列腺癌（PrCA）決策資訊的效果，包括ChatGPT-3.5、ChatGPT-4.0、Microsoft Copilot等。研究重點在於回應的準確性、完整性、可讀性和可信度，特別針對低識字率族群及高風險的非裔美國男性。結果顯示，雖然資訊準確，但完整性和可讀性各有差異。Microsoft Copilot Pro在標準篩檢問題上表現最佳，而Microsoft Copilot則在低識字率回應中表現突出。總體來說，AI聊天機器人可作為前列腺癌篩檢資訊的輔助資源，但仍需醫療專業指導。 PubMed DOI

Quality of Information Provided by Artificial Intelligence Chatbots Surrounding the Management of Vestibular Schwannomas: A Comparative Analysis Between ChatGPT-4 and Claude 2.
人工智慧聊天機器人提供的有關前庭神經瘤管理的資訊質量：ChatGPT-4 與 Claude 2 的比較分析。 Otol Neurotol 2025-02-18

這項研究評估了兩個人工智慧平台，ChatGPT-4 和 Claude 2，對前庭神經瘤管理資訊的品質。由19位側顱底外科醫生組成的評估小組使用醫療人工智慧品質評估問卷（QAMAI）來檢視36個問題的回答。結果顯示，ChatGPT-4在38.9%的問題上表現優於Claude 2，而Claude 2僅在5.6%的問題上得分較高。雖然ChatGPT-4在大多數方面表現較佳，但兩者在提供準確資訊上仍有困難，顯示患者使用這些工具時面臨錯誤資訊的風險。 PubMed DOI

Assessing the quality and readability of patient education materials on chemotherapy cardiotoxicity from artificial intelligence chatbots: An observational cross-sectional study.
評估人工智慧聊天機器人提供的化療心臟毒性患者教育材料的質量和可讀性：一項觀察性橫斷面研究。 Medicine (Baltimore) 2025-04-14

這項研究調查了AI聊天機器人生成的化療相關病人教育材料的質量與可讀性。研究於2024年8月進行，針對四個聊天機器人（ChatGPT、Microsoft Copilot、Google Gemini和Meta AI）提出十個問題。結果顯示，這些材料的平均閱讀年級為13.7，範圍在12.5到14.2之間。質量評估使用了PEMAT和DISCERN系統，平均DISCERN分數為4.2，顯示出高質量，而PEMAT的可理解性和可行性中位數分別為91.7%和75%。研究指出，雖然AI能生成高質量的材料，但可讀性較差，可能影響病人理解，建議謹慎使用，並強調需進一步研究AI在病人教育中的有效性。 PubMed DOI

Evaluating an AI Chatbot "Prostate Cancer Info" for Providing Quality Prostate Cancer Screening Information: Cross-Sectional Study.
「評估 AI 聊天機器人 'Prostate Cancer Info' 提供高品質前列腺癌篩檢資訊之效能：橫斷面研究」 JMIR Cancer 2025-05-21

「Prostate Cancer Info」AI聊天機器人回答前列腺癌篩檢問題時，大多內容正確且符合台灣常用語，74%答案完整，閱讀難度也不高。不過，有些重要資訊還是會漏掉。這類AI可以當作補充參考，但不能取代醫師專業建議，遇到健康問題還是要找醫生討論。 PubMed DOI

Evaluating AI Chatbots for Preoperative and Postoperative Counseling for Mandibular Distraction Osteogenesis.
用於下頜骨牽引成骨術術前與術後衛教諮詢之 AI 聊天機器人評估 J Craniofac Surg 2025-06-09

這項研究發現，AI 聊天機器人（像是ChatGPT、Copilot等）在回答兒童下頜骨延長術常見照護問題時，雖然Copilot表現最好，但整體來說，答案不夠可靠、資料來源不足，而且用詞太艱深，病人和家屬很難看懂，暫時還不適合當作醫療諮詢的主要工具。 PubMed DOI

Evaluation of AI-Based Chatbots in Liver Cancer Information Dissemination: A Comparative Analysis of GPT, DeepSeek, Copilot, and Gemini.
AI 聊天機器人在肝癌資訊傳播中的評估：GPT、DeepSeek、Copilot 與 Gemini 之比較分析 Oncology 2025-06-10

這項研究比較四款免費AI聊天機器人回答肝癌相關問題的表現，發現它們雖然能提供大致正確且無偏見的資訊，但在資料來源、治療細節和說明清楚度上有差異。AI回答可作為參考，但仍需專業醫師把關，不能取代醫療建議。 PubMed DOI

Evaluating the Reliability and Quality of Sarcoidosis-Related Information Provided by AI Chatbots.
AI 聊天機器人所提供有關 Sarcoidosis 資訊之可靠性與品質評估 Healthcare (Basel) 2025-06-13

這項研究發現，採用檢索增強技術的AI聊天機器人（如ChatGPT-4o Deep Research等）在提供結節病資訊時，比一般AI更準確可靠。不過，他們的回答多半太艱深，病人不易看懂，而且給的實際建議也不夠明確。整體來說，AI雖然能提供高品質資訊，但在易讀性和實用性上還有進步空間。 PubMed DOI

原始文章

站上相關主題文章列表