A Cross-Sectional Study Comparing Patient Information Guides Generated by ChatGPT and Google Gemini for Common Radiological Procedures.
比較 ChatGPT 和 Google Gemini 生成的常見放射學程序患者資訊指南的橫斷面研究。 Cureus 2025-01-01

這項研究評估了AI工具ChatGPT和Google Gemini在製作腹部超音波、CT掃描和MRI病患教育手冊的效果。研究於2024年6月進行，持續一週，分析了字數、句子數、可讀性和內容可靠性等指標。結果顯示，除了ChatGPT的字數和年級水平較高外，兩者在大多數指標上差異不大。兩個工具的內容在可讀性和可靠性上相似，但字數和複雜度的差異顯示需要更好地調整內容，以符合不同病患的識字能力。 PubMed DOI

Can Artificial Intelligence Create an Accurate Colonoscopy Bowel Preparation Prompt?
人工智慧能否創建準確的結腸鏡腸道準備提示？ Gastro Hep Adv 2025-01-27

結直腸癌是美國第三常見的癌症，結腸鏡檢查是主要篩檢方法，但約25%的病例因準備不當影響檢查效果。人工智慧（AI）在醫學上越來越受重視，特別是在腸胃科。研究評估了ChatGPT生成的腸道準備提示，調查208位腸胃科醫生的看法。結果顯示，91%的醫生認為提示易懂，95%認為科學準確，66%願意與病人分享。這顯示AI在臨床溝通和效率上有潛力。 PubMed DOI

Ability of ChatGPT to Replace Doctors in Patient Education: Cross-Sectional Comparative Analysis of Inflammatory Bowel Disease.
ChatGPT 在病人教育中取代醫生的能力：炎症性腸病的橫斷面比較分析。 J Med Internet Res 2025-03-31

這項研究評估了ChatGPT在提供慢性疾病患者教育方面的表現，特別針對炎症性腸病（IBD），並與專科醫生的回應進行比較。結果顯示，ChatGPT的整體品質評分與專科醫生相似，且在信息完整性上有明顯優勢。雖然準確性無顯著差異，但在患者和醫生共同回應時，ChatGPT表現較差。研究建議在健康信息創建和評估中，應納入患者的參與，以提升質量和相關性。 PubMed DOI

Performance of Large Language Models (ChatGPT and Gemini Advanced) in Gastrointestinal Pathology and Clinical Review of Applications in Gastroenterology.
大型語言模型（ChatGPT 與 Gemini Advanced）在腸胃道病理學的表現及其於腸胃科應用的臨床回顧 Cureus 2025-05-05

這項研究比較了ChatGPT-4.0、ChatGPT-3.5和Google Gemini Advanced在20個腸胃道病理案例的表現。結果顯示，ChatGPT-4.0和Gemini Advanced部分表現較佳，但整體水準還是普通。三款AI都無法正確判斷癌症分期，且有不少引用文獻是假的。研究認為，AI雖然進步中，但臨床應用前還是需要專家把關。 PubMed DOI

Concordance of ChatGPT artificial intelligence decision-making in colorectal cancer multidisciplinary meetings: retrospective study.
ChatGPT 人工智慧在大腸直腸癌多專科會議決策一致性的回顧性研究 BJS Open 2025-05-07

這項研究發現，ChatGPT-4在大腸直腸癌治療建議上，和多專科團隊（MDT）有七到八成以上的一致性。年紀大或病情複雜的病人，建議較容易不一樣。整體來說，ChatGPT有機會成為臨床決策的輔助工具，和專業團隊的建議相當接近。 PubMed DOI

Comparing Diagnostic Accuracy of ChatGPT to Clinical Diagnosis in General Surgery Consults: A Quantitative Analysis of Disease Diagnosis.
ChatGPT 與臨床診斷於一般外科會診中疾病診斷準確度之比較：一項定量分析 Mil Med 2025-05-13

這項研究評估ChatGPT在診斷急性闌尾炎、膽囊炎和憩室炎的表現，發現它雖然整體表現不錯，但在膽囊炎和憩室炎的診斷準確度還是比不上臨床醫師。有些症狀會讓AI搞混，導致誤判。總結來說，ChatGPT在資源有限的情況下可以當作輔助工具，但遇到複雜病例還需要再加強。 PubMed DOI

Exploring ChatGPT effectiveness in addressing direct patient queries on colorectal cancer screening.
探討 ChatGPT 回應大腸直腸癌篩檢病患直接詢問之成效 Endosc Int Open 2025-05-16

這項研究發現，ChatGPT-4o能準確、完整又清楚地回答病人關於大腸直腸癌篩檢的問題，專家和病人都給予高度評價，回答也很一致。顯示ChatGPT有潛力幫助病人了解篩檢資訊，提升參與意願。 PubMed DOI

Battle of the Bots: Assessing the Ability of Four Large Language Models to Tackle Different Surgery Topics.
機器人大對決：評估四種大型語言模型處理不同外科主題的能力 Am Surg 2025-05-27

這項研究比較四款AI聊天機器人在外科選擇題的表現，發現Copilot表現最佳，ChatGPT次之，Bard和Medical Chat較弱。各專科表現有落差，尤其耳鼻喉科和腸胃科最明顯。所有AI在診斷題的表現都優於處置題，Bard差異最大。結果顯示AI在外科教育和臨床應用各有優缺點。 PubMed DOI

Comparative evaluation of the accuracy and reliability of ChatGPT versions in providing information on <i>Helicobacter pylori</i> infection.
ChatGPT 各版本在提供有關 Helicobacter pylori 感染資訊之準確性與可靠性的比較評估 Front Public Health 2025-05-30

這項研究比較了三種ChatGPT版本在回答幽門螺旋桿菌相關問題的表現。結果顯示，ChatGPT-4o答得最準確但穩定性較差，3.5版則最穩定但偶有錯誤。整體來說，AI聊天機器人能有效協助病患衛教，也能幫醫師提供可靠醫療資訊。 PubMed DOI

Evaluating the Reliability of OpenAI's ChatGPT-4 in Providing Pre-colonoscopy Patient Guidance.
評估 OpenAI 的 ChatGPT-4 在提供大腸鏡檢查前病患指導的可靠性 Cureus 2025-07-23

這項研究發現，ChatGPT-4.0在回答大腸鏡檢查前常見問題時，內容準確且符合醫學指引，有潛力成為病人衛教的好幫手。不過，還需要更多實際測試和不同問題的驗證，才能確定它的實用性。 PubMed DOI

原始文章

站上相關主題文章列表