Adequacy of prostate cancer prevention and screening recommendations provided by an artificial intelligence-powered large language model.
人工智慧大型語言模型提供的攝護腺癌預防和篩檢建議的適當性。 Int Urol Nephrol 2024-04-02

研究比較了ChatGPT在回答攝護腺癌篩檢問題時的表現，發現GPT-4優於GPT-3.5，易讀性也更高。提示影響回應質量，尤其是清晰度。 PubMed DOI

The Emerging Role of Large Language Models in Improving Prostate Cancer Literacy.
大型語言模型在提升前列腺癌知識中的新興角色。 Bioengineering (Basel) 2024-07-27

這項研究評估了大型語言模型（LLMs）驅動的聊天機器人，如ChatGPT 3.5、CoPilot和Gemini，在提供前列腺癌資訊的有效性，並與官方病人指南進行比較。研究使用25個專家驗證的問題，根據準確性、及時性、完整性和可理解性進行評估。結果顯示，ChatGPT 3.5的表現優於其他模型，證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性，並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

Performance of ChatGPT-4 and Bard chatbots in responding to common patient questions on prostate cancer 177Lu-PSMA-617 therapy.
ChatGPT-4 和 Bard 聊天機器人在回答有關前列腺癌 177Lu-PSMA-617 治療的常見病人問題中的表現。 Front Oncol 2024-07-29

這項研究評估了OpenAI的ChatGPT-4和Google的Bard在回答前列腺癌新療法177Lu-PSMA-617的準確性、可讀性和簡潔性。結果顯示，ChatGPT-4的回答準確性較高（得分2.95對2.73），但Bard的可讀性更佳（得分2.79對2.94）。兩者在簡潔性上相似。ChatGPT-4的錯誤資訊較少（16.6%），而Bard則有較多誤導性資訊。總體來看，這兩個AI仍需改進，才能成為病人尋求相關資訊的可靠來源。 PubMed DOI

Evaluating the Efficacy of ChatGPT as a Patient Education Tool in Prostate Cancer: Multimetric Assessment.
評估 ChatGPT 作為前列腺癌患者教育工具的有效性：多指標評估。 J Med Internet Res 2024-08-14

這項研究評估了ChatGPT-4對前列腺癌常見問題的回答質量。研究人員制定了八個問題，並由四位評審使用多種工具評估AI的回答。結果顯示，ChatGPT-4的可理解性得分很高，但可讀性卻顯示「難以閱讀」，平均達到11年級的水平。雖然大部分參考文獻都來自可信來源，但仍有兩個例子被識別為參考幻覺。總體來看，ChatGPT-4在患者教育中提供了一般可靠的回答，但在可讀性和準確性上仍需改進。 PubMed DOI

Performance of large language models (LLMs) in providing prostate cancer information.
大型語言模型 (LLMs) 在提供前列腺癌資訊中的表現。 BMC Urol 2024-08-23

這項研究評估了AI聊天機器人，特別是ChatGPT和Google Bard在提供前列腺癌教育資訊的表現。研究發現，所有大型語言模型的準確性相似，但ChatGPT-3.5在一般知識上表現優異。ChatGPT-4的回答則更全面，而Bard的回答最易讀，獲得最高的易讀性分數。總體來說，這些AI模型雖無法取代醫療專業人員，但能有效協助病人了解前列腺癌的相關知識。 PubMed DOI

Can Patients With Urogenital Cancer Rely on Artificial Intelligence Chatbots for Treatment Decisions?
泌尿生殖系統癌症患者能否依賴人工智慧聊天機器人進行治療決策？ Clin Genitourin Cancer 2024-09-05

在人工智慧時代，許多病人會在線上尋找健康資訊。本研究評估了三個人工智慧聊天機器人（ChatGPT、Gemini、Copilot）提供的泌尿生殖系統癌症治療資訊的可靠性。評審結果顯示，ChatGPT和Gemini的資訊質量中等，分別得41分和42分，而Copilot得分較低（35分）。整體可理解性偏低，只有Gemini的可行性得分達60%。這顯示病人需謹慎使用這些工具，因為它們提供的資訊質量和可靠性普遍不高，且難以理解。 PubMed DOI

Evaluation of ChatGPT as a Reliable Source of Medical Information on Prostate Cancer for Patients: Global Comparative Survey of Medical Oncologists and Urologists.
評估 ChatGPT 作為前列腺癌患者可靠醫療資訊來源的能力：全球醫療腫瘤科醫師與泌尿科醫師的比較調查。 Urol Pract 2024-11-07

這項研究評估了ChatGPT在生成前列腺癌相關醫療回應的表現。研究期間為2023年4月至6月，超過700名醫療腫瘤科和泌尿科醫師參與，且他們不知是在評估AI。結果顯示，602名受訪者在9個問題中有7個偏好AI生成的回應，但仍認為醫療網站更可信。98名受訪者對AI生成的複雜問題回應給予高評價，顯示臨床醫師欣賞AI的清晰度，但仍偏好傳統網站作為資訊來源。這提供了對臨床醫師評估AI內容的見解，並為未來的AI驗證研究提出了評估標準。 PubMed DOI

Quality of Chatbot Information Related to Benign Prostatic Hyperplasia.
良性前列腺增生相關聊天機器人資訊的品質。 Prostate 2024-11-08

大型語言模型（LLM）聊天機器人被用來提供泌尿科疾病資訊，特別是良性前列腺增生手術。研究評估了四個聊天機器人的資訊質量，結果顯示未提示時資訊質量中等，但使用特定提示後顯著改善。回應準確性高達98%，但可讀性較差，超過大多數美國人的閱讀水平。總體來看，這些聊天機器人有助於患者教育，但需注意提示方式和語言複雜性，以提升其效益。 PubMed DOI

Comparative Evaluation of Information Quality on Colon Cancer for Patients: A Study of ChatGPT-4 and Google.
對於患者的結腸癌資訊品質比較評估：ChatGPT-4 與 Google 的研究。 Cureus 2024-12-20

本研究比較了ChatGPT-4和Google在結腸癌相關問題上的資訊質量與可靠性。選取二十個常見問題進行評估，結果顯示ChatGPT-4在可靠性、準確性和可理解性上均優於Google。雖然Google的可見性較高，但其資訊的可靠性仍令人擔憂。總體而言，ChatGPT-4在提供結腸癌醫療資訊方面表現更佳，顯示出AI平台在病人教育上的潛力，但仍需進一步研究以確認這些結果的普遍性。 PubMed DOI

Are AI chatbots concordant with evidence-based cancer screening recommendations?
AI 聊天機器人是否與基於證據的癌症篩檢建議一致？ Patient Educ Couns 2025-01-25

這項研究評估了AI聊天機器人，特別是ChatGPT，提供的乳腺癌和前列腺癌篩檢資訊的準確性，並與美國預防服務工作組（USPSTF）的指導方針進行比較。研究發現，71.7%的標準與USPSTF建議一致，但有15%的資訊不準確或不相關，特別是在針對年長者的回應中。雖然ChatGPT的資訊大致符合官方指導，但仍有顯著差距，提醒使用者在參考AI生成的癌症篩檢資訊時，應諮詢專業醫療人員。 PubMed DOI

原始文章

站上相關主題文章列表