原始文章

這項研究評估了ChatGPT對上尿路尿路上皮癌(UTUC)病人常見問題的回應質量。共15個問題被分為一般資訊、症狀與診斷、治療及預後。泌尿科醫生根據五個標準評分,結果顯示平均得分為3.93,其中一般資訊得分最高(4.14),治療相關回應得分最低(3.68)。雖然ChatGPT能提供基本資訊,但在治療問題上未完全滿足需求,且有安全隱患,建議在病人教育中謹慎使用。 PubMed DOI


站上相關主題文章列表

生成式人工智慧如CHATGPT在臨床護理和醫學教育中被應用。一項研究評估了CHATGPT 4在模擬加拿大泌尿科醫學委員會考試中的表現,結果顯示得分為46%,低於即將畢業的泌尿科住院醫師平均分數。CHATGPT在不同主題上表現有差異,尤其在腫瘤學方面表現較差。研究建議持續評估生成式人工智慧的能力,並進一步開發和訓練以提升在泌尿科領域的應用價值。 PubMed DOI

這項研究評估了ChatGPT在歐洲泌尿學會的考試表現,特別是版本3.5和4。分析了2017至2022年的多選題,結果顯示ChatGPT-4在所有考試中表現優於3.5,且每次考試都達到及格分數(≥60%)。不過,ChatGPT-4在某些子主題如尿失禁和移植的表現有所下降。整體來看,研究指出ChatGPT-4能有效回答複雜醫學問題,但仍需人類驗證其回應在醫療環境中的可靠性。 PubMed DOI

本研究探討人工智慧,特別是自然語言處理模型如ChatGPT,對於男性根治性前列腺切除術後勃起功能障礙(ED)患者的教育與知情同意的潛力。結果顯示,雖然ChatGPT能提供有關陰莖假體植入手術的資訊,但其質量和可理解性仍不足以幫助患者做出知情決策。評估結果顯示資訊的清晰度高,但複雜主題的理解度較低,顯示出改進AI生成內容的必要性。 PubMed DOI

這項研究評估了ChatGPT在泌尿婦科手術知情同意方面的回答準確性與可讀性。五位專家醫師針對四種手術進行評估,結果顯示質量中等,DISCERN中位數評分為3,後恥骨中尿道吊帶得分最高。準確性方面,44%的回答被認為「正確且充分」,但也有不少回答含有誤導性或不正確的信息,特別是關於手術好處和替代方案。可讀性達到研究生水平,顯示在醫療環境中需對其輸出進行專業審查。 PubMed DOI

這項研究評估了ChatGPT對甲狀腺癌相關問題的回答品質,因為患者常透過網路尋求健康資訊。八位醫療專家對ChatGPT的20個回答進行評分,結果顯示只有57%的回應準確,56%完整,52%令人滿意。質性分析指出,回應中對飲食和碘攝取的過度強調,以及甲狀腺手術和放射性碘治療風險的資訊不完整或不準確。研究結果顯示,ChatGPT目前並不可靠,無法在無監督下提供甲狀腺癌的患者資訊。 PubMed DOI

生成式 AI 工具如 ChatGPT 在醫療查詢中越來越受歡迎,特別是在解答髕腱病相關問題上。一項研究評估了 ChatGPT-4 的表現,收集了 48 個問題並由專家評估其回應。結果顯示,只有 33% 的回應準確,但 75% 是全面的。治療相關問題的準確率僅 17%。回應的可讀性達到大學水平,且可理解性良好(83%),但可行性較低(60%)。總體而言,ChatGPT-4 提供了豐富資訊,但準確性不足,且對於低學歷者不易理解。 PubMed DOI

這項研究評估了ChatGPT在提供重建泌尿學資訊的有效性,重點在於資訊質量、錯誤資訊、可讀性及提示工程的影響。研究發現: - **資訊質量**:平均DISCERN分數為3.63,顯示健康資訊質量中等。 - **可讀性**:回應的可讀性相當於大學畢業生,可能影響某些病人的理解。 - **可理解性與可行性**:可理解性高達85.3%,但可行性僅37.2%,顯示資訊雖清晰但缺乏實用步驟。 - **錯誤資訊**:錯誤資訊極少,平均分數為1.23。 - **提示工程**:精煉提示可顯著改善回應質量與可理解性,且不增加錯誤資訊。 總體而言,ChatGPT-4o在重建泌尿學病人教育上有潛力,但仍需關注可行性與閱讀水平。 PubMed DOI

尿道下裂是一種常見的先天性疾病,對父母的教育非常重要。本研究探討了ChatGPT在提供尿道下裂相關資訊的表現,針對診斷、治療及術後護理提出問題,並使用PEMAT-P工具評估其可理解性和可行性。結果顯示可理解性得分平均為88%,可行性則為51%。在準確性評估中,41%的回應被認為完全準確。整體Kappa值為0.607,顯示醫生間對資訊準確性有共識。未來需改善回應的準確性,並考慮加入視覺輔助工具以協助父母。 PubMed DOI

這項研究是首個評估ChatGPT在泌尿科急症問題上的有效性。研究分析了患者在社交媒體和網站上的常見問題,並根據歐洲泌尿學會的指導方針進行評估。結果顯示,在73個常見問題中,有72.6%獲得最高分5分,但基於指導方針的問題表現較差,只有54.8%達到5分。整體來看,ChatGPT能準確回答大多數常見問題,但在指導方針問題上表現不如預期。 PubMed DOI

研究發現,ChatGPT在回答中國病患常見的食道癌問題時,預防和診斷類的答案較正確,但治療和預後相關的答案有三成多部分錯誤。雖然沒有完全錯誤的回答,但在治療建議上還不夠可靠,建議未來需再改進才能推薦給病患使用。 PubMed DOI