原始文章

這項研究評估了AI聊天機器人在提供Wilms腫瘤資訊的有效性,特別針對患者及其家庭。透過Google Trends找出常見問題,測試了四款聊天機器人(ChatGPT 3.5、Perplexity、Chat Sonic和Bing AI)。結果顯示,所有機器人在資訊質量上得分良好,錯誤資訊極少,平均回應長度為275字,適合高中或大學學生閱讀。雖然資訊可理解性高達83%,但可行性較低,僅40%。總體而言,AI聊天機器人提供的資訊準確且易懂,但仍需醫療專業人員進一步澄清。 PubMed DOI


站上相關主題文章列表

這項研究評估了四種大型語言模型(LLM)工具——ChatGPT、Google Bard、Microsoft Bing Chat 和 Google SGE——在提供癌症兒童照顧者資訊的有效性。研究使用26個常見問題,五位小兒腫瘤學專家根據多項標準進行評估。結果顯示,ChatGPT整體表現最佳,特別在複雜性上,而Google Bard在準確性和清晰度上表現突出。Bing Chat和Google SGE得分較低。專家強調情感語調和同理心的重要性,未來需進一步研究這些工具在其他醫療領域的應用。 PubMed DOI

這項研究評估了三款AI聊天機器人—ChatGPT 4.0、Claude 3.0和Gemini Pro—以及Google在回答腎臟移植後常見問題的表現。研究使用5點李克特量表評估回應質量,並透過病人教育材料評估工具(PEMAT)檢視可理解性和可行性。結果顯示,回應質量高(中位分數4),可理解性良好(中位72.7%),但可行性較差(中位20%)。可讀性較難,Claude 3.0提供最可靠的回應,而ChatGPT 4.0則在可理解性上表現突出。Google在各項指標上未能超越這些聊天機器人。 PubMed DOI

這項研究評估了五款AI聊天機器人對口腔癌問題的回應,包括Bing、GPT-3.5、GPT-4、Google Bard和Claude。經過專家評估,GPT-4獲得最高質量分數(17.3),而Bing最低(14.9)。Bard在可讀性上表現最佳,GPT-4和Bard在同理心及引用準確性方面也表現突出。整體來看,GPT-4提供的回應質量最高,但大多數聊天機器人在同理心和準確引用上仍有待加強。 PubMed DOI

這項研究評估了多款AI聊天機器人在提供前列腺癌(PrCA)決策資訊的效果,包括ChatGPT-3.5、ChatGPT-4.0、Microsoft Copilot等。研究重點在於回應的準確性、完整性、可讀性和可信度,特別針對低識字率族群及高風險的非裔美國男性。結果顯示,雖然資訊準確,但完整性和可讀性各有差異。Microsoft Copilot Pro在標準篩檢問題上表現最佳,而Microsoft Copilot則在低識字率回應中表現突出。總體來說,AI聊天機器人可作為前列腺癌篩檢資訊的輔助資源,但仍需醫療專業指導。 PubMed DOI

這項研究評估了兩個人工智慧平台,ChatGPT-4 和 Claude 2,對前庭神經瘤管理資訊的品質。由19位側顱底外科醫生組成的評估小組使用醫療人工智慧品質評估問卷(QAMAI)來檢視36個問題的回答。結果顯示,ChatGPT-4在38.9%的問題上表現優於Claude 2,而Claude 2僅在5.6%的問題上得分較高。雖然ChatGPT-4在大多數方面表現較佳,但兩者在提供準確資訊上仍有困難,顯示患者使用這些工具時面臨錯誤資訊的風險。 PubMed DOI

這項研究調查了AI聊天機器人生成的化療相關病人教育材料的質量與可讀性。研究於2024年8月進行,針對四個聊天機器人(ChatGPT、Microsoft Copilot、Google Gemini和Meta AI)提出十個問題。結果顯示,這些材料的平均閱讀年級為13.7,範圍在12.5到14.2之間。 質量評估使用了PEMAT和DISCERN系統,平均DISCERN分數為4.2,顯示出高質量,而PEMAT的可理解性和可行性中位數分別為91.7%和75%。研究指出,雖然AI能生成高質量的材料,但可讀性較差,可能影響病人理解,建議謹慎使用,並強調需進一步研究AI在病人教育中的有效性。 PubMed DOI

「Prostate Cancer Info」AI聊天機器人回答前列腺癌篩檢問題時,大多內容正確且符合台灣常用語,74%答案完整,閱讀難度也不高。不過,有些重要資訊還是會漏掉。這類AI可以當作補充參考,但不能取代醫師專業建議,遇到健康問題還是要找醫生討論。 PubMed DOI

這項研究發現,AI 聊天機器人(像是ChatGPT、Copilot等)在回答兒童下頜骨延長術常見照護問題時,雖然Copilot表現最好,但整體來說,答案不夠可靠、資料來源不足,而且用詞太艱深,病人和家屬很難看懂,暫時還不適合當作醫療諮詢的主要工具。 PubMed DOI

這項研究比較四款免費AI聊天機器人回答肝癌相關問題的表現,發現它們雖然能提供大致正確且無偏見的資訊,但在資料來源、治療細節和說明清楚度上有差異。AI回答可作為參考,但仍需專業醫師把關,不能取代醫療建議。 PubMed DOI

這項研究發現,採用檢索增強技術的AI聊天機器人(如ChatGPT-4o Deep Research等)在提供結節病資訊時,比一般AI更準確可靠。不過,他們的回答多半太艱深,病人不易看懂,而且給的實際建議也不夠明確。整體來說,AI雖然能提供高品質資訊,但在易讀性和實用性上還有進步空間。 PubMed DOI