原始文章

這項研究評估了AI聊天機器人在提供Wilms腫瘤資訊的有效性,特別針對患者及其家庭。透過Google Trends找出常見問題,測試了四款聊天機器人(ChatGPT 3.5、Perplexity、Chat Sonic和Bing AI)。結果顯示,所有機器人在資訊質量上得分良好,錯誤資訊極少,平均回應長度為275字,適合高中或大學學生閱讀。雖然資訊可理解性高達83%,但可行性較低,僅40%。總體而言,AI聊天機器人提供的資訊準確且易懂,但仍需醫療專業人員進一步澄清。 PubMed DOI


站上相關主題文章列表

研究發現,人工智慧聊天機器人提供的泌尿系惡性腫瘤資訊通常準確,但指示不清晰,內容閱讀難度高。使用者可能難以理解並採取行動。 PubMed DOI

研究用DISCERN標準評估AI聊天機器人對常見癌症問題回答的品質,發現ChatGPT比Bing AI表現較好。AI在醫療上有潛力,但仍需改進,尤其在癌症等重要領域,以避免給患者和家人帶來誤解或壓力。 PubMed DOI

這項研究評估了人工智慧(AI)聊天機器人提供的腎結石相關資訊的品質。聊天機器人通常提供高品質且準確的資訊,沒有錯誤資訊。然而,這些資訊呈現在較高階的閱讀水準,使得尋求健康資訊的消費者較難理解和採取行動。 PubMed DOI

這項研究評估了五款AI聊天機器人(GPT-4、Claude、Mistral、Google PaLM和Grok)對腎結石相關問題的回答質量。研究透過Google Trends找出熱門搜尋詞,並針對每個機器人提供25個查詢。分析工具包括DISCERN、PEMAT-P等。結果顯示,無一機器人的回答達到理想的可理解性標準。Grok在易懂性上表現最佳,而GPT-4則最難理解。整體來看,這些聊天機器人有潛力改善醫療溝通與病人理解。 PubMed DOI

在人工智慧時代,許多病人會在線上尋找健康資訊。本研究評估了三個人工智慧聊天機器人(ChatGPT、Gemini、Copilot)提供的泌尿生殖系統癌症治療資訊的可靠性。評審結果顯示,ChatGPT和Gemini的資訊質量中等,分別得41分和42分,而Copilot得分較低(35分)。整體可理解性偏低,只有Gemini的可行性得分達60%。這顯示病人需謹慎使用這些工具,因為它們提供的資訊質量和可靠性普遍不高,且難以理解。 PubMed DOI

人工智慧(AI)在醫療領域的應用,特別是針對腎癌的病人教育材料(PEMs),帶來了顯著變化。本研究比較了ChatGPT 4.0、Gemini AI和Perplexity AI生成的資訊準確性與可讀性,並與美國泌尿學會(AUA)和歐洲泌尿學會(EAU)的PEMs進行對照。結果顯示,AUA的PEM可讀性最佳,AI生成的內容雖然準確,但在治療資訊上有些小遺漏。雖然AI能簡化內容,但在病人教育中使用時仍需謹慎,以免造成誤解。 PubMed DOI

這項研究探討AI聊天機器人對骨肉瘤患者護理的影響,分析其風險與好處。研究者向三個聊天機器人提出與診斷、治療和康復相關的問題,並根據五個指標評估其回答。結果顯示,聊天機器人在相關性和平衡性方面表現良好,但在數據基礎、完整性和事實準確性上得分較低。GPT-4在同理心方面得分最高,但在治療和康復問題的可行性較低。整體而言,雖然AI有潛力,但在準確性和可及性上仍有待改善,影響其臨床應用。 PubMed DOI

這項研究評估了AI聊天機器人提供的對比劑相關急性腎損傷(CAAKI)資訊的可靠性。研究人員向ChatGPT、Gemini、Copilot和Perplexity四個聊天機器人詢問常見問題,結果顯示Perplexity的資訊評價為「良好」,其他則為「一般」。所有回應的可讀性都很複雜,需要大學程度才能理解,且可理解性和適用性評分都偏低。雖然在李克特量表上獲得良好評價,但研究指出AI提供的CAAKI資訊仍可能不夠易懂。 PubMed DOI

這項研究評估了三款AI聊天機器人—ChatGPT 4.0、Claude 3.0和Gemini Pro—以及Google在回答腎臟移植後常見問題的表現。研究使用5點李克特量表評估回應質量,並透過病人教育材料評估工具(PEMAT)檢視可理解性和可行性。結果顯示,回應質量高(中位分數4),可理解性良好(中位72.7%),但可行性較差(中位20%)。可讀性較難,Claude 3.0提供最可靠的回應,而ChatGPT 4.0則在可理解性上表現突出。Google在各項指標上未能超越這些聊天機器人。 PubMed DOI

這項研究評估了多款AI聊天機器人在提供前列腺癌(PrCA)決策資訊的效果,包括ChatGPT-3.5、ChatGPT-4.0、Microsoft Copilot等。研究重點在於回應的準確性、完整性、可讀性和可信度,特別針對低識字率族群及高風險的非裔美國男性。結果顯示,雖然資訊準確,但完整性和可讀性各有差異。Microsoft Copilot Pro在標準篩檢問題上表現最佳,而Microsoft Copilot則在低識字率回應中表現突出。總體來說,AI聊天機器人可作為前列腺癌篩檢資訊的輔助資源,但仍需醫療專業指導。 PubMed DOI