Digesting Digital Health: A Study of Appropriateness and Readability of ChatGPT-Generated Gastroenterological Information.
消化數位健康：ChatGPT 生成的胃腸病學資訊的適當性與可讀性研究。 Clin Transl Gastroenterol 2024-08-30

這項研究評估了ChatGPT生成的胃腸科資訊的質量與可讀性，特別針對對話式和定義式問題的回應。三位認證的胃腸科醫生使用5點李克特量表評估回應的適當性，涵蓋六個類別。結果顯示，44%的對話式回應和69%的定義式回應被認為適當，但與胃腸急症相關的回應則全都不適當。可讀性評估顯示這些內容需大學程度的閱讀能力。總體而言，雖然ChatGPT能生成一般適合的回應，但在適當性和可讀性上仍需改進，才能成為可靠的醫療資訊來源。 PubMed DOI

Application of large language model combined with retrieval enhanced generation technology in digestive endoscopic nursing.
結合檢索增強生成技術的大型語言模型在消化內鏡護理中的應用。 Front Med (Lausanne) 2024-11-21

這項研究強調了Endo-chat醫療聊天應用程式的開發，利用檢索增強生成（RAG）技術來提升對胃腸內視鏡檢查的回應準確性與效率。透過整合內部數據和胃腸科指導方針，Endo-chat能提供準確且專業的答案，並在回應效率、完整性及患者滿意度上超越傳統手動方式。雖然與ChatGPT相比，準確性差異不大，但患者更喜愛這項AI服務，並支持其實施。護理人員也認為AI能減輕工作負擔，總體而言，Endo-chat被視為消化內視鏡護理的有效輔助工具。 PubMed DOI

Conversational LLM Chatbot ChatGPT-4 for Colonoscopy Boston Bowel Preparation Scoring: An Artificial Intelligence-to-Head Concordance Analysis.
ChatGPT-4 會話式 LLM 聊天機器人於結腸鏡檢查波士頓腸道準備評分的應用：人工智慧與專家之間的一致性分析。 Diagnostics (Basel) 2024-11-27

這項研究評估了ChatGPT-4在分析663張匿名內視鏡影像時，對結腸鏡檢查腸道準備品質的表現。結果顯示，ChatGPT-4僅將62.9%的影像評為準備充分，而人類評估者則有89.3%。兩者之間的協議程度不高，κ值為0.099。人類的平均BBPS分數為3，ChatGPT-4則為2，顯示出中等一致性（W: 0.554）。雖然ChatGPT-4在評估腸道準備品質上有潛力，但仍需進一步改進。 PubMed DOI

Evaluating ChatGPT-4 for the Interpretation of Images from Several Diagnostic Techniques in Gastroenterology.
評估 ChatGPT-4 在消化內科多種診斷技術影像解讀中的應用。 J Clin Med 2025-01-25

這項研究評估了ChatGPT-4在解讀各種胃腸科影像的表現，分析了740張影像，並將預測結果與既有診斷進行比較。結果顯示，ChatGPT-4的準確性在不同程序中差異明顯，膠囊內視鏡的準確率介於50%到90%之間，設備輔助腸鏡為67%，而內視鏡超音波和高解析度肛門鏡的表現則較差。整體來看，這顯示ChatGPT-4的診斷能力尚不理想，臨床應用前仍需進一步改進。 PubMed DOI

Ability of ChatGPT to Replace Doctors in Patient Education: Cross-Sectional Comparative Analysis of Inflammatory Bowel Disease.
ChatGPT 在病人教育中取代醫生的能力：炎症性腸病的橫斷面比較分析。 J Med Internet Res 2025-03-31

這項研究評估了ChatGPT在提供慢性疾病患者教育方面的表現，特別針對炎症性腸病（IBD），並與專科醫生的回應進行比較。結果顯示，ChatGPT的整體品質評分與專科醫生相似，且在信息完整性上有明顯優勢。雖然準確性無顯著差異，但在患者和醫生共同回應時，ChatGPT表現較差。研究建議在健康信息創建和評估中，應納入患者的參與，以提升質量和相關性。 PubMed DOI

ChatGPT-4o outperforms gemini advanced in assisting multidisciplinary decision-making for advanced gastric cancer.
ChatGPT-4o 在協助晚期胃癌多學科決策方面優於 Gemini Advanced Eur J Surg Oncol 2025-04-28

這項研究發現，ChatGPT-4o在晚期胃癌治療建議的準確性和完整性上，表現都比Gemini Advanced更穩定。不過，兩者的建議都只能當作輔助工具，還是需要專業醫師監督，不能單獨用來做臨床決策。 PubMed DOI

Assessing ChatGPT for clinical decision-making in radiation oncology, with open-ended questions and images.
在放射腫瘤科臨床決策中，利用開放式問題與影像評估 ChatGPT 的表現 Pract Radiat Oncol 2025-05-01

這項研究發現，ChatGPT-4和4O在放射腫瘤科的文字型臨床問題上表現不錯，能提供實用建議，但遇到複雜或技術性高的情境就不太可靠。特別是在判讀鼻咽癌MRI影像時，ChatGPT-4O完全無法正確分期。總結來說，ChatGPT適合輔助一般臨床決策，但影像判讀還不行，使用時要特別小心。 PubMed DOI

Performance of Large Language Models (ChatGPT and Gemini Advanced) in Gastrointestinal Pathology and Clinical Review of Applications in Gastroenterology.
大型語言模型（ChatGPT 與 Gemini Advanced）在腸胃道病理學的表現及其於腸胃科應用的臨床回顧 Cureus 2025-05-05

這項研究比較了ChatGPT-4.0、ChatGPT-3.5和Google Gemini Advanced在20個腸胃道病理案例的表現。結果顯示，ChatGPT-4.0和Gemini Advanced部分表現較佳，但整體水準還是普通。三款AI都無法正確判斷癌症分期，且有不少引用文獻是假的。研究認為，AI雖然進步中，但臨床應用前還是需要專家把關。 PubMed DOI

Artificial Intelligence in Gastroenterology Education: DeepSeek Passes the Gastroenterology Board Examination and Outperforms Legacy ChatGPT Models.
腸胃科教育中的人工智慧：DeepSeek 通過腸胃科專科醫師考試並優於舊版 ChatGPT 模型 Am J Gastroenterol 2025-05-20

DeepSeek 這款新 AI 在腸胃科專科考試表現比舊版 ChatGPT 更好，分數都超過及格線。不過，DeepSeek 對冷門題目還是有盲點，也還沒辦法看影像，實際應用還需要專科醫師再確認。 PubMed DOI

Enhancing gastroenterology with multimodal learning: the role of large language model chatbots in digestive endoscopy.
以多模態學習提升腸胃科：大型語言模型聊天機器人在消化內視鏡的角色 Front Med (Lausanne) 2025-06-05

這項研究提出一套結合大型語言模型、內視鏡影像和病患資料的AI系統，能即時輔助醫師判讀、偵測病灶並自動產生報告。透過自我監督和領域自適應學習，系統提升了診斷準確率和一致性，強化醫師與AI的合作，展現多模態AI在內視鏡檢查上的應用潛力。 PubMed DOI

原始文章

站上相關主題文章列表