原始文章

這項研究評估了ChatGPT在回答慢性腎病(CKD)常見問題的可靠性與重現性。研究人員分析了85個問題,最終納入60個進行評估。兩位腎臟科醫生對答案進行1到4的評分,結果顯示85%的問題得分為1,表示可靠性低,只有11.7%得分為2,3.3%得分為3。重複問題的答案相似度在80%到100%之間。總體來看,雖然大多數答案質量不高,但ChatGPT在CKD問題上的回應仍具可靠性和高重現性。 PubMed DOI


站上相關主題文章列表

研究評估了ChatGPT回答腎臟學考題的能力,發現使用GPT-4時準確率提升至74%,但仍未達及格標準。答案一致性率為78%,正確答案比率高。在不同子領域表現不同,有些準確率較低。ChatGPT在回答腎臟學問題時有準確性和一致性限制。 PubMed DOI

研究發現ChatGPT在回答男性生殖學問題時,87.9%的答案正確且充分。對於某些主題,正確率更高。超過80%的問題得到準確可靠的答案,顯示在醫療領域有潛力,但也有限制。 PubMed DOI

研究評估了ChatGPT 4.0在回答患者教育問題時對於梅奧診所手冊上有關急性腎損傷(AKI)和持續性腎臟替代治療(CRRT)的專業知識的熟練程度。ChatGPT表現準確率高(97-98%),包括原始、改寫和拼寫錯誤的問題。在AKI和CRRT問題上表現沒有明顯差異。結果顯示ChatGPT 4.0可作為腎臟學患者教育的可靠工具,但仍需進一步研究其對患者理解和教育成果的影響。 PubMed DOI

研究發現ChatGPT在心臟衰竭問答方面表現優異,GPT-4回答準確全面,GPT-3.5表現也不錯。這些模型展現高度可信度,可能成為心臟衰竭患者重要資源,但仍需進一步驗證確保安全公平。 PubMed DOI

2022年11月,OpenAI推出的ChatGPT引起了醫學界的關注。最近研究顯示,ChatGPT-4.0在腎臟科考試中表現優於ChatGPT-3.5,正確率分別為69.84%和45.70%。研究使用了1,560個問題進行比較,結果顯示ChatGPT-4.0在13次測試中通過了11次,超過60%及格率,甚至超越了人類醫生的平均得分85.73%。雖然ChatGPT-4.0表現強勁,但人類醫生的表現仍然更佳。 PubMed DOI

慢性腎臟病(CKD)患者透過個性化的生活方式和營養管理教育能顯著改善健康。自2022年起,研究開始使用聊天機器人來教育CKD患者,並根據KDIGO指導方針設計了15個問題。研究測試了多個AI版本,包括ChatGPT 3.5、ChatGPT 4和Bard AI,並由腎臟科醫生審查其回答的準確性。結果顯示,雖然有些誤導性資訊,但整體上聊天機器人作為教育工具的潛力明顯,並在2023年有顯著改進。醫療專業人員與AI開發者的合作對提升醫療服務至關重要。 PubMed DOI

這項研究評估了ChatGPT-4在腎臟科專業意見上的一致性,並將其回應與平台X的社群投票結果進行比較。經過兩輪測試,涵蓋271個問題,結果顯示第一輪一致性為60.2%(κ = 0.42),第二輪稍微提升至63.1%(κ = 0.46)。內部一致性高達90.4%(κ = 0.86),在穩態調節、腎結石和藥理學等領域表現較佳(κ = 0.53)。總體來看,ChatGPT-4在腎臟科的主流意見重現上有適度能力,但表現因主題而異,顯示出AI在醫療決策中的潛力與限制。 PubMed DOI

ChatGPT在腎臟移植領域的表現仍需進一步評估。一項研究測試了其3.5、4和4 Visual版本,使用了12道基於美國腎臟學會的考題。結果顯示,4 V版本正確回答了10道,與腎臟學研究生的9道相當,而培訓主任則答對11道。相比之下,4版本答對7道,3.5版本僅5道。雖然ChatGPT在腎臟移植問題上展現潛力,但應視為輔助工具,而非專業知識的替代品。 PubMed DOI

這項研究評估了AI聊天機器人提供的對比劑相關急性腎損傷(CAAKI)資訊的可靠性。研究人員向ChatGPT、Gemini、Copilot和Perplexity四個聊天機器人詢問常見問題,結果顯示Perplexity的資訊評價為「良好」,其他則為「一般」。所有回應的可讀性都很複雜,需要大學程度才能理解,且可理解性和適用性評分都偏低。雖然在李克特量表上獲得良好評價,但研究指出AI提供的CAAKI資訊仍可能不夠易懂。 PubMed DOI

這項研究評估了三款AI聊天機器人—ChatGPT 4.0、Claude 3.0和Gemini Pro—以及Google在回答腎臟移植後常見問題的表現。研究使用5點李克特量表評估回應質量,並透過病人教育材料評估工具(PEMAT)檢視可理解性和可行性。結果顯示,回應質量高(中位分數4),可理解性良好(中位72.7%),但可行性較差(中位20%)。可讀性較難,Claude 3.0提供最可靠的回應,而ChatGPT 4.0則在可理解性上表現突出。Google在各項指標上未能超越這些聊天機器人。 PubMed DOI