A Comparison of Prostate Cancer Screening Information Quality on Standard and Advanced Versions of ChatGPT, Google Gemini, and Microsoft Copilot: A Cross-Sectional Study.
標準版與進階版 ChatGPT、Google Gemini 和 Microsoft Copilot 在前列腺癌篩檢資訊品質的比較：一項橫斷面研究。 Am J Health Promot 2025-01-24

這項研究評估了多款AI聊天機器人在提供前列腺癌（PrCA）決策資訊的效果，包括ChatGPT-3.5、ChatGPT-4.0、Microsoft Copilot等。研究重點在於回應的準確性、完整性、可讀性和可信度，特別針對低識字率族群及高風險的非裔美國男性。結果顯示，雖然資訊準確，但完整性和可讀性各有差異。Microsoft Copilot Pro在標準篩檢問題上表現最佳，而Microsoft Copilot則在低識字率回應中表現突出。總體來說，AI聊天機器人可作為前列腺癌篩檢資訊的輔助資源，但仍需醫療專業指導。 PubMed DOI

Assessing the readability, quality and reliability of responses produced by ChatGPT, Gemini, and Perplexity regarding most frequently asked keywords about low back pain.
評估 ChatGPT、Gemini 和 Perplexity 對於有關下背痛的最常見關鍵字所產生的回應的可讀性、質量和可靠性。 PeerJ 2025-01-27

這項研究分析了三款AI聊天機器人（ChatGPT、Perplexity和Gemini）在低背痛相關問題上的可讀性、可靠性和回應質量。研究使用25個常見搜尋關鍵字，評估這些機器人提供的資訊是否易懂且可靠。結果顯示，所有機器人的可讀性均高於六年級水平，表示資訊難以理解。Perplexity在質量評估中表現最佳，但整體而言，這些聊天機器人的回應質量和可靠性都偏低。研究建議未來應提升AI聊天機器人的資訊清晰度與質量，以更好地幫助患者。 PubMed DOI

Evaluating the fidelity of AI-generated information on long-acting reversible contraceptive methods.
評估 AI 生成的長效可逆避孕方法資訊的準確性。 Eur J Contracept Reprod Health Care 2025-02-06

這項研究評估了AI聊天機器人ChatGPT提供的長效可逆避孕法（LARC）資訊的準確性。研究發現，69.3%的回應準確，但16.3%包含過時或不準確的資訊，14.4%則有誤導性陳述。此外，45.1%的回應使用性別排他性語言，僅提及女性。平均可讀性分數顯示需具大學程度的閱讀能力。雖然ChatGPT提供的LARC資訊有其價值，但用戶應謹慎，並獨立驗證資訊的正確性。 PubMed DOI

Readability, reliability and quality of responses generated by ChatGPT, gemini, and perplexity for the most frequently asked questions about pain.
ChatGPT、Gemini 和 Perplexity 對於最常見的疼痛相關問題所生成的回答的可讀性、可靠性和質量。 Medicine (Baltimore) 2025-03-18

這項研究調查了三款AI聊天機器人—ChatGPT、Gemini和Perplexity—在回答有關疼痛的常見問題時的可讀性、可靠性和回應質量。全球超過30%的人口面臨慢性疼痛，許多人會在就醫前尋找健康資訊。研究發現，這三款聊天機器人的可讀性均超過六年級水平，其中Gemini最佳。質量方面，Gemini得分較高，而Perplexity在可靠性評估中表現較好。總體來說，這些聊天機器人的回應難以閱讀，且可靠性和質量較低，無法取代專業醫療諮詢，建議改善可讀性並加強專家監督。 PubMed DOI

Readability, accuracy and appropriateness and quality of AI chatbot responses as a patient information source on root canal retreatment: A comparative assessment.
AI 聊天機器人作為根管再治療病患資訊來源之可讀性、準確性、適切性與回應品質的比較評估 Int J Med Inform 2025-04-27

這項研究比較了ChatGPT-3.5、Copilot和Gemini三款聊天機器人，發現它們回答根管再治療相關問題時，內容都太難懂，超過一般病人能輕鬆理解的程度。雖然Gemini表現最好，但還是沒達到理想的衛教標準，顯示這些AI工具未來還需要加強，才能真正幫助病人了解醫療資訊。 PubMed DOI

Evaluating Accuracy and Readability of Responses to Midlife Health Questions: A Comparative Analysis of Six Large Language Model Chatbots.
六種大型語言模型聊天機器人對中年健康問題回答之準確性與可讀性評估：比較分析 J Midlife Health 2025-05-07

研究比較六款聊天機器人回答中年健康問題的表現，發現 Meta AI 答案最準確、最有條理，Perplexity 最容易閱讀。整體來說，這些聊天機器人對中年健康教育有幫助，但表現有差異，選擇合適的工具很重要。 PubMed DOI

Evaluation of artificial intelligence (AI) chatbots for providing sexual health information: a consensus study using real-world clinical queries.
人工智慧（AI）聊天機器人在提供性健康資訊方面的評估：一項基於真實臨床提問的共識研究 BMC Public Health 2025-05-15

這項研究發現，經過提示優化的AI聊天機器人（像Alice）在提供正確、準確和安全的健康資訊上，比標準版ChatGPT表現更好。不過，所有AI偶爾還是會出錯，所以只能當作輔助工具，不能取代醫療專業人員。未來若要廣泛應用，還需要持續改進並由人員監督。 PubMed DOI

Evaluating the Reliability and Quality of Sarcoidosis-Related Information Provided by AI Chatbots.
AI 聊天機器人所提供有關 Sarcoidosis 資訊之可靠性與品質評估 Healthcare (Basel) 2025-06-13

這項研究發現，採用檢索增強技術的AI聊天機器人（如ChatGPT-4o Deep Research等）在提供結節病資訊時，比一般AI更準確可靠。不過，他們的回答多半太艱深，病人不易看懂，而且給的實際建議也不夠明確。整體來說，AI雖然能提供高品質資訊，但在易讀性和實用性上還有進步空間。 PubMed DOI

Evaluating the readability, quality, and reliability of responses generated by ChatGPT, Gemini, and Perplexity on the most commonly asked questions about Ankylosing spondylitis.
ChatGPT、Gemini 與 Perplexity 回答最常見 Ankylosing spondylitis 問題之可讀性、品質與可靠性評估 PLoS One 2025-06-18

這項研究比較ChatGPT、Perplexity和Gemini三款AI聊天機器人，針對僵直性脊椎炎的回答。結果發現，三者的答案都超過國中六年級的閱讀難度，一般人較難看懂。Perplexity的資訊最可靠、品質也最好。不過，整體來說，這些AI在可讀性、正確性和品質上還有進步空間，未來仍需加強與監督。 PubMed DOI

The Reliability Gap: How Traditional Search Engines Outperform Artificial Intelligence (AI) Chatbots in Rosacea Public Health Information Quality.
可靠性差距：傳統搜尋引擎在 Rosacea 公共衛生資訊品質上優於人工智慧（AI）聊天機器人 Cureus 2025-07-23

這項研究比較Google、Bing、ChatGPT和Gemini的健康資訊，發現Google的資訊最可靠、品質最好，ChatGPT和Gemini在正確性和透明度較弱。四個平台的內容閱讀難度都偏高，超過公衛建議。結果顯示AI健康資訊需要更嚴格監督，也要加強民眾的資訊判讀能力。 PubMed DOI

原始文章

站上相關主題文章列表