A Comparison of Prostate Cancer Screening Information Quality on Standard and Advanced Versions of ChatGPT, Google Gemini, and Microsoft Copilot: A Cross-Sectional Study.
標準版與進階版 ChatGPT、Google Gemini 和 Microsoft Copilot 在前列腺癌篩檢資訊品質的比較：一項橫斷面研究。 Am J Health Promot 2025-01-24

這項研究評估了多款AI聊天機器人在提供前列腺癌（PrCA）決策資訊的效果，包括ChatGPT-3.5、ChatGPT-4.0、Microsoft Copilot等。研究重點在於回應的準確性、完整性、可讀性和可信度，特別針對低識字率族群及高風險的非裔美國男性。結果顯示，雖然資訊準確，但完整性和可讀性各有差異。Microsoft Copilot Pro在標準篩檢問題上表現最佳，而Microsoft Copilot則在低識字率回應中表現突出。總體來說，AI聊天機器人可作為前列腺癌篩檢資訊的輔助資源，但仍需醫療專業指導。 PubMed DOI

Readability, reliability and quality of responses generated by ChatGPT, gemini, and perplexity for the most frequently asked questions about pain.
ChatGPT、Gemini 和 Perplexity 對於最常見的疼痛相關問題所生成的回答的可讀性、可靠性和質量。 Medicine (Baltimore) 2025-03-18

這項研究調查了三款AI聊天機器人—ChatGPT、Gemini和Perplexity—在回答有關疼痛的常見問題時的可讀性、可靠性和回應質量。全球超過30%的人口面臨慢性疼痛，許多人會在就醫前尋找健康資訊。研究發現，這三款聊天機器人的可讀性均超過六年級水平，其中Gemini最佳。質量方面，Gemini得分較高，而Perplexity在可靠性評估中表現較好。總體來說，這些聊天機器人的回應難以閱讀，且可靠性和質量較低，無法取代專業醫療諮詢，建議改善可讀性並加強專家監督。 PubMed DOI

Online Health Information-Seeking in the Era of Large Language Models: Cross-Sectional Web-Based Survey Study.
大型語言模型時代的線上健康資訊搜尋：橫斷面網路調查研究。 J Med Internet Res 2025-03-31

這項研究探討使用者對大型語言模型（LLM）驅動的聊天機器人（如ChatGPT）提供的健康資訊的看法，與傳統線上資源相比。結果顯示，98%的參與者仍主要依賴搜尋引擎尋找健康資訊，只有21.2%使用聊天機器人。大多數人尋求健康狀況資訊，但對於用藥建議和自我診斷的需求較低。雖然LLM聊天機器人逐漸受到年輕族群的青睞，但使用者在遵循建議時仍較為謹慎。研究強調提高準確性和透明度對於健康資訊的安全性至關重要。 PubMed DOI

AI Chatbots as Sources of STD Information: A Study on Reliability and Readability.
AI 聊天機器人作為性病資訊的來源：可靠性和可讀性的研究。 J Med Syst 2025-04-03

這項研究評估了四款AI聊天機器人（ChatGPT、Gemini、Perplexity和Copilot）提供的性傳播疾病資訊的可靠性和可讀性。結果顯示，Perplexity和Copilot的資訊較為可靠，但所有聊天機器人的可讀性都未達到建議的六年級標準，對健康素養較低的使用者來說過於複雜。研究強調了改善AI健康資訊準確性和可及性的必要性，以便讓更多人能理解。 PubMed DOI

Leveraging artificial intelligence chatbots for anemia prevention: A comparative study of ChatGPT-3.5, copilot, and Gemini outputs against Google Search results.
運用人工智慧聊天機器人於貧血預防：ChatGPT-3.5、copilot 與 Gemini 輸出結果對比 Google Search 的比較研究 PEC Innov 2025-04-25

這項研究比較ChatGPT-3.5、Copilot、Gemini三款AI聊天機器人，用日文產生的貧血資訊，發現AI內容（尤其是Gemini）在易懂性、可行性和可讀性都比Google搜尋前幾名網頁好。顯示AI有潛力提供更優質、好懂的健康資訊，但未來還需加強圖像等視覺元素的整合。 PubMed DOI

Readability, accuracy and appropriateness and quality of AI chatbot responses as a patient information source on root canal retreatment: A comparative assessment.
AI 聊天機器人作為根管再治療病患資訊來源之可讀性、準確性、適切性與回應品質的比較評估 Int J Med Inform 2025-04-27

這項研究比較了ChatGPT-3.5、Copilot和Gemini三款聊天機器人，發現它們回答根管再治療相關問題時，內容都太難懂，超過一般病人能輕鬆理解的程度。雖然Gemini表現最好，但還是沒達到理想的衛教標準，顯示這些AI工具未來還需要加強，才能真正幫助病人了解醫療資訊。 PubMed DOI

Evaluating the Reliability and Quality of Sarcoidosis-Related Information Provided by AI Chatbots.
AI 聊天機器人所提供有關 Sarcoidosis 資訊之可靠性與品質評估 Healthcare (Basel) 2025-06-13

這項研究發現，採用檢索增強技術的AI聊天機器人（如ChatGPT-4o Deep Research等）在提供結節病資訊時，比一般AI更準確可靠。不過，他們的回答多半太艱深，病人不易看懂，而且給的實際建議也不夠明確。整體來說，AI雖然能提供高品質資訊，但在易讀性和實用性上還有進步空間。 PubMed DOI

Evaluating the readability, quality, and reliability of responses generated by ChatGPT, Gemini, and Perplexity on the most commonly asked questions about Ankylosing spondylitis.
ChatGPT、Gemini 與 Perplexity 回答最常見 Ankylosing spondylitis 問題之可讀性、品質與可靠性評估 PLoS One 2025-06-18

這項研究比較ChatGPT、Perplexity和Gemini三款AI聊天機器人，針對僵直性脊椎炎的回答。結果發現，三者的答案都超過國中六年級的閱讀難度，一般人較難看懂。Perplexity的資訊最可靠、品質也最好。不過，整體來說，這些AI在可讀性、正確性和品質上還有進步空間，未來仍需加強與監督。 PubMed DOI

Accuracy and Reliability of Artificial Intelligence Chatbots as Public Information Sources in Implant Dentistry.
人工智慧聊天機器人在植體牙科作為公共資訊來源的準確性與可靠性 Int J Oral Maxillofac Implants 2025-06-25

這項研究比較了ChatGPT-3.5、Gemini和Copilot三款AI聊天機器人在回答植牙常見問題時的表現。結果發現，三者正確性差不多，但Gemini的答案較完整，Copilot的一致性最好。不過，三款AI的正確率都不高，建議不能直接用來做牙科決策，還是要依靠專業醫師判斷。 PubMed DOI

Evaluating the effectiveness of chatbots and traditional resources in patient education on dry eye disease.
評估聊天機器人與傳統資源於乾眼症患者衛教之成效 Clin Exp Optom 2025-06-26

AI聊天機器人（如ChatGPT-3.5、Gemini、Llama）提供的乾眼症資訊，正確度和易懂度跟美國眼科醫學會（AAO）官網差不多。Gemini說明最容易理解，AAO內容最容易閱讀。雖然AI回答語言較複雜，對部分病患來說可能較難懂，但整體資訊正確且安全。AI可作為病患衛教輔助，但不能取代醫師，未來應加強易讀性。 PubMed DOI

原始文章

站上相關主題文章列表