原始文章

這項研究評估了多款AI聊天機器人在提供前列腺癌(PrCA)決策資訊的效果,包括ChatGPT-3.5、ChatGPT-4.0、Microsoft Copilot等。研究重點在於回應的準確性、完整性、可讀性和可信度,特別針對低識字率族群及高風險的非裔美國男性。結果顯示,雖然資訊準確,但完整性和可讀性各有差異。Microsoft Copilot Pro在標準篩檢問題上表現最佳,而Microsoft Copilot則在低識字率回應中表現突出。總體來說,AI聊天機器人可作為前列腺癌篩檢資訊的輔助資源,但仍需醫療專業指導。 PubMed DOI


站上相關主題文章列表

研究比較了ChatGPT在回答攝護腺癌篩檢問題時的表現,發現GPT-4優於GPT-3.5,易讀性也更高。提示影響回應質量,尤其是清晰度。 PubMed DOI

這項研究評估了大型語言模型(LLMs)驅動的聊天機器人,如ChatGPT 3.5、CoPilot和Gemini,在提供前列腺癌資訊的有效性,並與官方病人指南進行比較。研究使用25個專家驗證的問題,根據準確性、及時性、完整性和可理解性進行評估。結果顯示,ChatGPT 3.5的表現優於其他模型,證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性,並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

這項研究評估了OpenAI的ChatGPT-4和Google的Bard在回答前列腺癌新療法<sup>177</sup>Lu-PSMA-617的準確性、可讀性和簡潔性。結果顯示,ChatGPT-4的回答準確性較高(得分2.95對2.73),但Bard的可讀性更佳(得分2.79對2.94)。兩者在簡潔性上相似。ChatGPT-4的錯誤資訊較少(16.6%),而Bard則有較多誤導性資訊。總體來看,這兩個AI仍需改進,才能成為病人尋求相關資訊的可靠來源。 PubMed DOI

這項研究評估了ChatGPT-4對前列腺癌常見問題的回答質量。研究人員制定了八個問題,並由四位評審使用多種工具評估AI的回答。結果顯示,ChatGPT-4的可理解性得分很高,但可讀性卻顯示「難以閱讀」,平均達到11年級的水平。雖然大部分參考文獻都來自可信來源,但仍有兩個例子被識別為參考幻覺。總體來看,ChatGPT-4在患者教育中提供了一般可靠的回答,但在可讀性和準確性上仍需改進。 PubMed DOI

這項研究評估了AI聊天機器人,特別是ChatGPT和Google Bard在提供前列腺癌教育資訊的表現。研究發現,所有大型語言模型的準確性相似,但ChatGPT-3.5在一般知識上表現優異。ChatGPT-4的回答則更全面,而Bard的回答最易讀,獲得最高的易讀性分數。總體來說,這些AI模型雖無法取代醫療專業人員,但能有效協助病人了解前列腺癌的相關知識。 PubMed DOI

在人工智慧時代,許多病人會在線上尋找健康資訊。本研究評估了三個人工智慧聊天機器人(ChatGPT、Gemini、Copilot)提供的泌尿生殖系統癌症治療資訊的可靠性。評審結果顯示,ChatGPT和Gemini的資訊質量中等,分別得41分和42分,而Copilot得分較低(35分)。整體可理解性偏低,只有Gemini的可行性得分達60%。這顯示病人需謹慎使用這些工具,因為它們提供的資訊質量和可靠性普遍不高,且難以理解。 PubMed DOI

這項研究評估了ChatGPT在生成前列腺癌相關醫療回應的表現。研究期間為2023年4月至6月,超過700名醫療腫瘤科和泌尿科醫師參與,且他們不知是在評估AI。結果顯示,602名受訪者在9個問題中有7個偏好AI生成的回應,但仍認為醫療網站更可信。98名受訪者對AI生成的複雜問題回應給予高評價,顯示臨床醫師欣賞AI的清晰度,但仍偏好傳統網站作為資訊來源。這提供了對臨床醫師評估AI內容的見解,並為未來的AI驗證研究提出了評估標準。 PubMed DOI

大型語言模型(LLM)聊天機器人被用來提供泌尿科疾病資訊,特別是良性前列腺增生手術。研究評估了四個聊天機器人的資訊質量,結果顯示未提示時資訊質量中等,但使用特定提示後顯著改善。回應準確性高達98%,但可讀性較差,超過大多數美國人的閱讀水平。總體來看,這些聊天機器人有助於患者教育,但需注意提示方式和語言複雜性,以提升其效益。 PubMed DOI

本研究比較了ChatGPT-4和Google在結腸癌相關問題上的資訊質量與可靠性。選取二十個常見問題進行評估,結果顯示ChatGPT-4在可靠性、準確性和可理解性上均優於Google。雖然Google的可見性較高,但其資訊的可靠性仍令人擔憂。總體而言,ChatGPT-4在提供結腸癌醫療資訊方面表現更佳,顯示出AI平台在病人教育上的潛力,但仍需進一步研究以確認這些結果的普遍性。 PubMed DOI

這項研究評估了AI聊天機器人,特別是ChatGPT,提供的乳腺癌和前列腺癌篩檢資訊的準確性,並與美國預防服務工作組(USPSTF)的指導方針進行比較。研究發現,71.7%的標準與USPSTF建議一致,但有15%的資訊不準確或不相關,特別是在針對年長者的回應中。雖然ChatGPT的資訊大致符合官方指導,但仍有顯著差距,提醒使用者在參考AI生成的癌症篩檢資訊時,應諮詢專業醫療人員。 PubMed DOI