The Emerging Role of Large Language Models in Improving Prostate Cancer Literacy.
大型語言模型在提升前列腺癌知識中的新興角色。 Bioengineering (Basel) 2024-07-27

這項研究評估了大型語言模型（LLMs）驅動的聊天機器人，如ChatGPT 3.5、CoPilot和Gemini，在提供前列腺癌資訊的有效性，並與官方病人指南進行比較。研究使用25個專家驗證的問題，根據準確性、及時性、完整性和可理解性進行評估。結果顯示，ChatGPT 3.5的表現優於其他模型，證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性，並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

A Comparison of Prostate Cancer Screening Information Quality on Standard and Advanced Versions of ChatGPT, Google Gemini, and Microsoft Copilot: A Cross-Sectional Study.
標準版與進階版 ChatGPT、Google Gemini 和 Microsoft Copilot 在前列腺癌篩檢資訊品質的比較：一項橫斷面研究。 Am J Health Promot 2025-01-24

這項研究評估了多款AI聊天機器人在提供前列腺癌（PrCA）決策資訊的效果，包括ChatGPT-3.5、ChatGPT-4.0、Microsoft Copilot等。研究重點在於回應的準確性、完整性、可讀性和可信度，特別針對低識字率族群及高風險的非裔美國男性。結果顯示，雖然資訊準確，但完整性和可讀性各有差異。Microsoft Copilot Pro在標準篩檢問題上表現最佳，而Microsoft Copilot則在低識字率回應中表現突出。總體來說，AI聊天機器人可作為前列腺癌篩檢資訊的輔助資源，但仍需醫療專業指導。 PubMed DOI

Are AI chatbots concordant with evidence-based cancer screening recommendations?
AI 聊天機器人是否與基於證據的癌症篩檢建議一致？ Patient Educ Couns 2025-01-25

這項研究評估了AI聊天機器人，特別是ChatGPT，提供的乳腺癌和前列腺癌篩檢資訊的準確性，並與美國預防服務工作組（USPSTF）的指導方針進行比較。研究發現，71.7%的標準與USPSTF建議一致，但有15%的資訊不準確或不相關，特別是在針對年長者的回應中。雖然ChatGPT的資訊大致符合官方指導，但仍有顯著差距，提醒使用者在參考AI生成的癌症篩檢資訊時，應諮詢專業醫療人員。 PubMed DOI

Quality of information on Wilms tumour from artificial intelligence chatbots: what are your patients and their families reading?
人工智慧聊天機器人提供的 Wilms 腫瘤資訊質量：您的病人及其家屬在閱讀什麼？ Urology 2025-02-06

這項研究評估了AI聊天機器人在提供Wilms腫瘤資訊的有效性，特別針對患者及其家庭。透過Google Trends找出常見問題，測試了四款聊天機器人（ChatGPT 3.5、Perplexity、Chat Sonic和Bing AI）。結果顯示，所有機器人在資訊質量上得分良好，錯誤資訊極少，平均回應長度為275字，適合高中或大學學生閱讀。雖然資訊可理解性高達83%，但可行性較低，僅40%。總體而言，AI聊天機器人提供的資訊準確且易懂，但仍需醫療專業人員進一步澄清。 PubMed DOI

Artificial intelligence and patient education.
人工智慧與病人教育。 Curr Opin Urol 2025-02-13

在泌尿科，AI 聊天機器人逐漸被重視，成為病人教育的工具。研究顯示，雖然這些機器人的回應通常準確，但語言過於複雜，病人難以理解。部分研究探討了它們生成通俗摘要或教育手冊的潛力，顯示未來可能成為有價值的資源。若能增強產生易懂內容的能力，這些聊天機器人能快速生成病人友好的資料，並由醫療專業人員審核。總之，AI 聊天機器人在改善病人教育方面具潛力，特別是能以簡單術語溝通時。 PubMed DOI

Evaluating interactions of patients with large language models for medical information.
評估患者與大型語言模型在醫療資訊上的互動。 BJU Int 2025-02-19

這項研究探討了患者與GPT-4驅動的聊天機器人在泌尿科諮詢中的互動。從2024年2月到7月，共招募300名患者，評估聊天機器人提供的醫療資訊質量。292名參與者完成了研究，結果顯示大多數患者認為聊天機器人的回應有用且易懂，但人類醫生的回答評價較高。53%的參與者偏好大型語言模型的問答能力。研究指出，這類模型可增強患者教育，並減輕醫療提供者的時間壓力。限制包括潛在的偏見和抽樣問題。 PubMed DOI

Evaluation of artificial intelligence (AI) chatbots for providing sexual health information: a consensus study using real-world clinical queries.
人工智慧（AI）聊天機器人在提供性健康資訊方面的評估：一項基於真實臨床提問的共識研究 BMC Public Health 2025-05-15

這項研究發現，經過提示優化的AI聊天機器人（像Alice）在提供正確、準確和安全的健康資訊上，比標準版ChatGPT表現更好。不過，所有AI偶爾還是會出錯，所以只能當作輔助工具，不能取代醫療專業人員。未來若要廣泛應用，還需要持續改進並由人員監督。 PubMed DOI

Evaluation of AI-Based Chatbots in Liver Cancer Information Dissemination: A Comparative Analysis of GPT, DeepSeek, Copilot, and Gemini.
AI 聊天機器人在肝癌資訊傳播中的評估：GPT、DeepSeek、Copilot 與 Gemini 之比較分析 Oncology 2025-06-10

這項研究比較四款免費AI聊天機器人回答肝癌相關問題的表現，發現它們雖然能提供大致正確且無偏見的資訊，但在資料來源、治療細節和說明清楚度上有差異。AI回答可作為參考，但仍需專業醫師把關，不能取代醫療建議。 PubMed DOI

Utilization of an AI-Powered Chatbot for Enhancing Oral Cancer Awareness among African Americans: Expert Feedback on Usability.
運用 AI 驅動聊天機器人提升非裔美國人對口腔癌的認知：專家對可用性的回饋 AMIA Jt Summits Transl Sci Proc 2025-06-12

這項研究測試了一款專為美國非裔族群設計的口腔癌AI聊天機器人，專家普遍認為它資訊正確、好用（正面回饋超過83%），但建議加強開場說明、介面簡單化、無障礙設計及專業術語解釋。整體來說，這個聊天機器人有助提升健康知識，減少健康不平等。 PubMed

Evaluating the Reliability and Quality of Sarcoidosis-Related Information Provided by AI Chatbots.
AI 聊天機器人所提供有關 Sarcoidosis 資訊之可靠性與品質評估 Healthcare (Basel) 2025-06-13

這項研究發現，採用檢索增強技術的AI聊天機器人（如ChatGPT-4o Deep Research等）在提供結節病資訊時，比一般AI更準確可靠。不過，他們的回答多半太艱深，病人不易看懂，而且給的實際建議也不夠明確。整體來說，AI雖然能提供高品質資訊，但在易讀性和實用性上還有進步空間。 PubMed DOI

原始文章

站上相關主題文章列表