原始文章

這項研究探討了大型語言模型ChatGPT在腎臟科病例分診的有效性,特別是在因人口老化導致腎臟問題增加的情況下。兩位腎臟科醫生設計了100個病人情境,結果顯示ChatGPT在判斷腎臟科需求的準確率高達99-100%,選擇正確子專科的準確率為96-99%,兩輪評估的協議率為97%。雖然結果顯示AI能提升醫療分診的效率與準確性,但仍需改進在複雜病情的多學科護理整合方面。整體而言,研究強調了AI在改善臨床決策及發展量身訂做的分診系統的潛力。 PubMed DOI


站上相關主題文章列表

這項研究探討使用人工智慧,特別是基於GPT-4的ChatGPT,來預測急診部的分流結果。研究涉及比較AI工具所做的決策與急診醫學專家的決策,專家的決策被視為黃金標準。結果顯示AI工具與專家之間有高度一致性,顯示ChatGPT有潛力有效地協助病人的分流。 PubMed DOI

本指南探討如何運用ChatGPT於腎臟病學,提升醫療決策與病患護理品質。優化ChatGPT對腎臟科醫師的應用是挑戰,透過設定使用者檔案和GPT-4功能,加強ChatGPT對腎臟相關問題的回應。比較思維鏈提示法和標準提示法在診斷腎源性尿崩症相關疾病的效果,並探討檢索增強生成技術在描述慢性腎臟疾病藥物干預方面的應用。思維鏈方法提供詳盡診斷過程,檢索增強生成則提供更準確的藥物選擇。整合這些技術可提升ChatGPT在腎臟學中的應用,強調在專業醫學領域中需度身訂製的人工智慧解決方案。 PubMed DOI

ChatGPT是一個由AI驅動的工具,用來協助門診分流。研究顯示,ChatGPT與手動分流結果高度一致,專家對其回答大多給予正面評價。另外,一項涵蓋45名患者的研究也顯示ChatGPT表現優異。ChatGPT的回答專業、全面且人性化,有助於改善治療時間、診斷,並緩解醫療人力不足問題,讓患者受益。 PubMed DOI

2022年11月,OpenAI推出的ChatGPT引起了醫學界的關注。最近研究顯示,ChatGPT-4.0在腎臟科考試中表現優於ChatGPT-3.5,正確率分別為69.84%和45.70%。研究使用了1,560個問題進行比較,結果顯示ChatGPT-4.0在13次測試中通過了11次,超過60%及格率,甚至超越了人類醫生的平均得分85.73%。雖然ChatGPT-4.0表現強勁,但人類醫生的表現仍然更佳。 PubMed DOI

這項研究評估了ChatGPT-4在腎臟科專業意見上的一致性,並將其回應與平台X的社群投票結果進行比較。經過兩輪測試,涵蓋271個問題,結果顯示第一輪一致性為60.2%(κ = 0.42),第二輪稍微提升至63.1%(κ = 0.46)。內部一致性高達90.4%(κ = 0.86),在穩態調節、腎結石和藥理學等領域表現較佳(κ = 0.53)。總體來看,ChatGPT-4在腎臟科的主流意見重現上有適度能力,但表現因主題而異,顯示出AI在醫療決策中的潛力與限制。 PubMed DOI

這項研究評估了ChatGPT在識別腎臟科疾病的ICD-10代碼的準確性,使用了模擬案例。兩位腎臟科醫生創建了100個案例,測試了ChatGPT的3.5和4.0版本。結果顯示,3.5版本的準確率為91%,而4.0版本則高達99%。雖然3.5在第二輪下降至87%,但4.0仍維持99%。這顯示4.0在腎臟科編碼上有顯著優勢,並可能減輕醫療人員的負擔。不過,仍需注意小錯誤率,強調持續改進AI系統的重要性。 PubMed DOI

這項研究評估了ChatGPT-4在腎臟科門診中對病人訊息的分流效果。研究創建了150條模擬病人訊息,兩位腎臟科醫生將其分類為非緊急、緊急或非常緊急,然後讓ChatGPT-4進行分流。結果顯示,ChatGPT在兩次試驗中都正確分流了93%的訊息,且準確性不受訊息緊急程度影響。這表明ChatGPT-4有潛力提升門診的運營效率和病人護理品質。 PubMed DOI

ChatGPT在腎臟移植領域的表現仍需進一步評估。一項研究測試了其3.5、4和4 Visual版本,使用了12道基於美國腎臟學會的考題。結果顯示,4 V版本正確回答了10道,與腎臟學研究生的9道相當,而培訓主任則答對11道。相比之下,4版本答對7道,3.5版本僅5道。雖然ChatGPT在腎臟移植問題上展現潛力,但應視為輔助工具,而非專業知識的替代品。 PubMed DOI

這項研究評估了兩個AI語言模型,GPT-3.5和GPT-4,在小兒腎臟科臨床資訊的有效性。40位小兒腎臟科專家對這些模型進行了評分,結果顯示兩者表現相似,GPT-4稍微高一些,但差異不顯著。分析顯示,模型的內部一致性較低,專家經驗與評價無明顯相關。研究指出,這些AI模型雖能提供基本資訊,但未能解決小兒腎臟科的特定挑戰,強調專業訓練和人類監督的重要性。 PubMed DOI

這項研究評估了ChatGPT 4.0在急診部門進行病人分診的效果,並與人類分診人員進行比較。分析了2,658名病人的數據,結果顯示AI與人類的分診協議程度較低(kappa = 0.125)。在人類分診預測30天死亡率和生命救援需求方面,表現明顯優於AI(ROC分別為0.88對0.70及0.98對0.87)。這顯示雖然AI有潛力,但在急診分診中仍不如人類可靠,特別是對高風險病人的評估。 PubMed DOI