原始文章

梅約內視鏡子評分(MES)是評估潰瘍性結腸炎(UC)黏膜活動的重要工具。本研究探討了人工智慧模型ChatGPT-4在根據MES評估UC患者內視鏡影像的有效性。專家小組審查了內視鏡影像並給予等級,只有一致評分的影像才進一步分析。結果顯示,ChatGPT-4的準確率為78.9%,而IBD專家的準確率為81.1%,兩者差異不顯著(P = 0.71)。研究表明,ChatGPT-4能有效評估UC患者的黏膜炎症,表現與專家相當,且無需額外調整。 PubMed DOI


站上相關主題文章列表

研究發現GPT-4在組織病理圖像中檢測結腸腺瘤的準確性,與病理醫師比較後,顯示敏感性為74%,特異性為36%。對於腺瘤檢測表現不錯,但在分類上有些差異。一致性稍嫌不足,顯示GPT-4仍有限制,強調病理醫師的專業知識和臨床經驗的重要性。 PubMed DOI

研究評估AI平台ChatGPT3.5對炎症性腸道疾病(IBD)問題回答的準確性和完整性。結果顯示,大部分回答準確,但完整性有差異。雖然問題組評分無差異,個別問題有不同。ChatGPT等AI系統可提供IBD相關資訊,但專業回答需更貼近指南並提供清晰建議。 PubMed DOI

研究發現,ChatGPT 4.0 在回答美國醫師執照考試問題及生成臨床鑑別診斷方面比 3.5 更準確。在74.6%案例中準確生成診斷,70.2%正確將診斷排第一。顯示ChatGPT在回答醫學問題上有進步,並展現臨床診斷能力。 PubMed DOI

這項研究評估了ChatGPT在回答幽門螺旋桿菌感染問題的準確性,並與腸胃科醫生進行比較。研究選取了25個問題,測試了ChatGPT3.5和ChatGPT4,結果顯示兩者準確率均高達92%,超過腸胃科醫生的80%。ChatGPT4的回答更簡潔,且在診斷和胃癌預防方面表現優於ChatGPT3.5。整體來看,ChatGPT在H. pylori相關問題上展現高準確性,對患者和醫生皆具價值。 PubMed DOI

這項研究評估了ChatGPT-4在抗凝治療管理方面的準確性,特別針對接受胃腸道手術的患者,並與ChatGPT-3.5及增強檢索生成模型(ChatGPT4-RAG)比較。結果顯示,ChatGPT-4的完全準確率為30.5%,而ChatGPT4-RAG則達到75%。儘管如此,研究指出75%的準確率仍不足以獨立做臨床決策,AI應視為醫生的輔助工具,並需持續評估以保障病人隱私及醫病關係。 PubMed DOI

這項研究評估了ChatGPT-4在分析663張匿名內視鏡影像時,對結腸鏡檢查腸道準備品質的表現。結果顯示,ChatGPT-4僅將62.9%的影像評為準備充分,而人類評估者則有89.3%。兩者之間的協議程度不高,κ值為0.099。人類的平均BBPS分數為3,ChatGPT-4則為2,顯示出中等一致性(W: 0.554)。雖然ChatGPT-4在評估腸道準備品質上有潛力,但仍需進一步改進。 PubMed DOI

這項研究評估了ChatGPT在泌尿科醫學影像解讀的有效性,特別是CT和MRI影像。結果顯示,ChatGPT在14%的CT和28%的MRI案例中準確識別首要診斷,雖然無顯著差異,但加入器官指導後,CT影像的準確率提升了18%。整體來看,雖然ChatGPT的初步有效性有限,但在用戶指導下,其表現可顯著改善,顯示AI在臨床應用中的潛力與限制。 PubMed DOI

這項研究評估了ChatGPT-4在解讀各種胃腸科影像的表現,分析了740張影像,並將預測結果與既有診斷進行比較。結果顯示,ChatGPT-4的準確性在不同程序中差異明顯,膠囊內視鏡的準確率介於50%到90%之間,設備輔助腸鏡為67%,而內視鏡超音波和高解析度肛門鏡的表現則較差。整體來看,這顯示ChatGPT-4的診斷能力尚不理想,臨床應用前仍需進一步改進。 PubMed DOI

這項研究評估了OpenAI開發的GPT-4在病理影像分析中的診斷準確性。研究涵蓋16個器官的44張組織病理影像及100張結直腸活檢顯微照片。GPT-4在腫瘤類型和組織來源的整體準確率為0.64,結腸息肉的分類準確率介於0.57到0.75之間。它在區分低級別和高級別不典型增生方面表現良好,準確率達0.88,對腺癌檢測的敏感性也很高。整體來看,GPT-4的表現與病理住院醫師相當,顯示其作為輔助工具的潛力。 PubMed DOI

這項研究評估了ChatGPT在提供慢性疾病患者教育方面的表現,特別針對炎症性腸病(IBD),並與專科醫生的回應進行比較。結果顯示,ChatGPT的整體品質評分與專科醫生相似,且在信息完整性上有明顯優勢。雖然準確性無顯著差異,但在患者和醫生共同回應時,ChatGPT表現較差。研究建議在健康信息創建和評估中,應納入患者的參與,以提升質量和相關性。 PubMed DOI