Assessing the precision of artificial intelligence in ED triage decisions: Insights from a study with ChatGPT.
評估人工智慧在急診分流決策中的精確性：ChatGPT 研究的洞察。 Am J Emerg Med 2024-03-25

這項研究探討使用人工智慧，特別是基於GPT-4的ChatGPT，來預測急診部的分流結果。研究涉及比較AI工具所做的決策與急診醫學專家的決策，專家的決策被視為黃金標準。結果顯示AI工具與專家之間有高度一致性，顯示ChatGPT有潛力有效地協助病人的分流。 PubMed DOI

How to improve ChatGPT performance for nephrologists: a technique guide.
如何提升 ChatGPT 在腎臟科醫師中的表現：技術指南。 J Nephrol 2024-05-21

本指南探討如何運用ChatGPT於腎臟病學，提升醫療決策與病患護理品質。優化ChatGPT對腎臟科醫師的應用是挑戰，透過設定使用者檔案和GPT-4功能，加強ChatGPT對腎臟相關問題的回應。比較思維鏈提示法和標準提示法在診斷腎源性尿崩症相關疾病的效果，並探討檢索增強生成技術在描述慢性腎臟疾病藥物干預方面的應用。思維鏈方法提供詳盡診斷過程，檢索增強生成則提供更準確的藥物選擇。整合這些技術可提升ChatGPT在腎臟學中的應用，強調在專業醫學領域中需度身訂製的人工智慧解決方案。 PubMed DOI

Assessing the utility of artificial intelligence throughout the triage outpatients: a prospective randomized controlled clinical study.
評估人工智慧在門診分流中的效用：一項前瞻性隨機對照臨床研究。 Front Public Health 2024-06-14

ChatGPT是一個由AI驅動的工具，用來協助門診分流。研究顯示，ChatGPT與手動分流結果高度一致，專家對其回答大多給予正面評價。另外，一項涵蓋45名患者的研究也顯示ChatGPT表現優異。ChatGPT的回答專業、全面且人性化，有助於改善治療時間、診斷，並緩解醫療人力不足問題，讓患者受益。 PubMed DOI

The potential of ChatGPT in medicine: an example analysis of nephrology specialty exams in Poland.
ChatGPT 在醫學中的潛力：波蘭腎臟科專業考試的範例分析。 Clin Kidney J 2024-08-05

2022年11月，OpenAI推出的ChatGPT引起了醫學界的關注。最近研究顯示，ChatGPT-4.0在腎臟科考試中表現優於ChatGPT-3.5，正確率分別為69.84%和45.70%。研究使用了1,560個問題進行比較，結果顯示ChatGPT-4.0在13次測試中通過了11次，超過60%及格率，甚至超越了人類醫生的平均得分85.73%。雖然ChatGPT-4.0表現強勁，但人類醫生的表現仍然更佳。 PubMed DOI

Digital health tools in nephrology: A comparative analysis of AI and professional opinions via online polls.
腎臟科數位健康工具：透過線上投票比較人工智慧與專業意見的分析。 Digit Health 2024-09-02

這項研究評估了ChatGPT-4在腎臟科專業意見上的一致性，並將其回應與平台X的社群投票結果進行比較。經過兩輪測試，涵蓋271個問題，結果顯示第一輪一致性為60.2%（κ = 0.42），第二輪稍微提升至63.1%（κ = 0.46）。內部一致性高達90.4%（κ = 0.86），在穩態調節、腎結石和藥理學等領域表現較佳（κ = 0.53）。總體來看，ChatGPT-4在腎臟科的主流意見重現上有適度能力，但表現因主題而異，顯示出AI在醫療決策中的潛力與限制。 PubMed DOI

AI integration in nephrology: evaluating ChatGPT for accurate ICD-10 documentation and coding.
腎臟科中的AI整合：評估ChatGPT在ICD-10文檔和編碼中的準確性。 Front Artif Intell 2024-09-17

這項研究評估了ChatGPT在識別腎臟科疾病的ICD-10代碼的準確性，使用了模擬案例。兩位腎臟科醫生創建了100個案例，測試了ChatGPT的3.5和4.0版本。結果顯示，3.5版本的準確率為91%，而4.0版本則高達99%。雖然3.5在第二輪下降至87%，但4.0仍維持99%。這顯示4.0在腎臟科編碼上有顯著優勢，並可能減輕醫療人員的負擔。不過，仍需注意小錯誤率，強調持續改進AI系統的重要性。 PubMed DOI

Large language model triaging of simulated nephrology patient inbox messages.
大型語言模型對模擬腎臟科病人收件箱訊息的分流。 Front Artif Intell 2024-09-24

這項研究評估了ChatGPT-4在腎臟科門診中對病人訊息的分流效果。研究創建了150條模擬病人訊息，兩位腎臟科醫生將其分類為非緊急、緊急或非常緊急，然後讓ChatGPT-4進行分流。結果顯示，ChatGPT在兩次試驗中都正確分流了93%的訊息，且準確性不受訊息緊急程度影響。這表明ChatGPT-4有潛力提升門診的運營效率和病人護理品質。 PubMed DOI

ChatGPT Solving Complex Kidney Transplant Cases: A Comparative Study With Human Respondents.
解決複雜腎臟移植案例的 ChatGPT：與人類受試者的比較研究。 Clin Transplant 2024-09-27

ChatGPT在腎臟移植領域的表現仍需進一步評估。一項研究測試了其3.5、4和4 Visual版本，使用了12道基於美國腎臟學會的考題。結果顯示，4 V版本正確回答了10道，與腎臟學研究生的9道相當，而培訓主任則答對11道。相比之下，4版本答對7道，3.5版本僅5道。雖然ChatGPT在腎臟移植問題上展現潛力，但應視為輔助工具，而非專業知識的替代品。 PubMed DOI

Assessing the performance of large language models (GPT-3.5 and GPT-4) and accurate clinical information for pediatric nephrology.
評估大型語言模型（GPT-3.5 和 GPT-4）在小兒腎臟科準確臨床資訊的表現。 Pediatr Nephrol 2025-03-05

這項研究評估了兩個AI語言模型，GPT-3.5和GPT-4，在小兒腎臟科臨床資訊的有效性。40位小兒腎臟科專家對這些模型進行了評分，結果顯示兩者表現相似，GPT-4稍微高一些，但差異不顯著。分析顯示，模型的內部一致性較低，專家經驗與評價無明顯相關。研究指出，這些AI模型雖能提供基本資訊，但未能解決小兒腎臟科的特定挑戰，強調專業訓練和人類監督的重要性。 PubMed DOI

Chat-GPT in triage: Still far from surpassing human expertise - An observational study.
Chat-GPT 在分診中的應用：仍然遠未超越人類專業知識 - 一項觀察性研究。 Am J Emerg Med 2025-03-22

這項研究評估了ChatGPT 4.0在急診部門進行病人分診的效果，並與人類分診人員進行比較。分析了2,658名病人的數據，結果顯示AI與人類的分診協議程度較低（kappa = 0.125）。在人類分診預測30天死亡率和生命救援需求方面，表現明顯優於AI（ROC分別為0.88對0.70及0.98對0.87）。這顯示雖然AI有潛力，但在急診分診中仍不如人類可靠，特別是對高風險病人的評估。 PubMed DOI

原始文章

站上相關主題文章列表