ChatGPT and retinal disease: a cross-sectional study on AI comprehension of clinical guidelines.
ChatGPT 與視網膜疾病：一項關於 AI 理解臨床指導方針的橫斷面研究。 Can J Ophthalmol 2024-08-03

這項研究評估了ChatGPT（4.0版）在生成與常見視網膜疾病相關回應的表現，依據美國眼科醫學會的指導方針進行。研究包含130個問題，涵蓋12個領域，專家評估回應的相關性和準確性。結果顯示，ChatGPT的平均得分為4.9分，與指導方針高度一致，但外科管理得分最低。回應可讀性較低，需大學以上理解能力，且在診斷和治療選擇上有錯誤。整體而言，雖然顯示潛力，但仍需臨床醫師監督及改進。 PubMed DOI

Evaluating ChatGPT's efficacy and readability to common pediatric ophthalmology and strabismus-related questions.
評估 ChatGPT 在常見小兒眼科和斜視相關問題上的效能與可讀性。 Eur J Ophthalmol 2024-08-07

這項研究評估了ChatGPT對家長詢問兒童眼科和斜視問題的回答準確性。分析了817個問題，結果顯示78.09%的回答完全正確，19.09%正確但不完整，只有2.81%部分不正確，且沒有完全錯誤的回答。平均可讀性分數為14.49，超過成人的標準，這引發了一些擔憂。儘管可讀性有待改善，研究仍顯示ChatGPT能提供準確可靠的資訊，顯示其在醫療領域的潛力。 PubMed DOI

Evaluating accuracy and reproducibility of ChatGPT responses to patient-based questions in Ophthalmology: An observational study.
評估 ChatGPT 對眼科病人相關問題的回答準確性和重現性：一項觀察性研究。 Medicine (Baltimore) 2024-08-09

這項研究評估了ChatGPT對眼科病人問題的回答準確性和重現性。研究人員從美國眼科學會的「詢問眼科醫生」頁面收集了150個問題，經過兩位眼科醫生的精煉，最終有117個問題輸入ChatGPT。結果顯示，ChatGPT對59.8%的問題提供了全面回答，且在91.5%的問題上保持一致性。雖然其準確性和重現性中等，但應視為健康資訊的輔助來源，而非專業醫療建議的替代品，未來仍需進一步研究以評估其可靠性。 PubMed DOI

Is ChatGPT 3.5 smarter than Otolaryngology trainees? A comparison study of board style exam questions.
ChatGPT 3.5 是否比耳鼻喉科實習生更聰明？一項關於考試題型的比較研究。 PLoS One 2024-09-26

這項研究評估了ChatGPT在考試中的表現，並與耳鼻喉科的實習生進行比較。31名醫學生和17名住院醫師回答了30道問題，結果顯示ChatGPT的表現超過了第一到第三年的醫學生，但不及第四和第五年的住院醫師。第四年醫學生和第一到第三年住院醫師的表現與ChatGPT相似。這顯示ChatGPT在死記硬背方面表現良好，但在臨床推理和解決複雜問題的能力上，仍無法與高年級實習生相比，顯示其臨床應用的限制。 PubMed DOI

Analysis of ChatGPT Responses to Ophthalmic Cases: Can ChatGPT Think like an Ophthalmologist?
ChatGPT 對眼科案例的回應分析：ChatGPT 能像眼科醫生一樣思考嗎？ Ophthalmol Sci 2024-09-30

這項研究評估了ChatGPT在眼科臨床評估中的表現，目的是檢視其準確性及眼科醫生是否能辨識其生成的回應。研究中，16位眼科醫生參與，ChatGPT在17個案例中準確識別了15個主要診斷（88.2%）。醫生們在13個案例中以77.9%的準確率辨識出回應作者，信心評分為3.6。醫生指出ChatGPT的回應較為一般，常有不相關資訊及句法模式。結論認為，雖然ChatGPT顯示潛力，但在臨床應用前仍需進一步評估。 PubMed DOI

Performance of ChatGPT in Ophthalmic Registration and Clinical Diagnosis: Cross-Sectional Study.
ChatGPT 在眼科註冊和臨床診斷中的表現：橫斷面研究。 J Med Internet Res 2024-11-14

這項研究探討了AI聊天機器人GPT-3.5和GPT-4.0在眼科門診註冊及診斷眼病的有效性。研究分析了208個臨床檔案，結果顯示： 1. **註冊建議**：GPT-3.5（63.5%）、GPT-4.0（77.9%）和住院醫師（69.2%）的準確性相似，無顯著差異。 2. **診斷準確性**：GPT-4.0和住院醫師在有病史及檢查的檔案中表現優於GPT-3.5。 3. **錯誤診斷**：GPT-4.0的錯誤診斷較少，顯示出精確度提升。 4. **整體表現**：GPT-4.0在鑑別診斷上接近住院醫師，顯示其潛在應用價值。結論認為，AI聊天機器人有助於提升眼科病人註冊，但需進一步驗證其在診斷中的應用。 PubMed DOI

Evaluating the Performance of ChatGPT 3.5 and 4.0 on StatPearls Oculoplastic Surgery Text- and Image-Based Exam Questions.
評估 ChatGPT 3.5 和 4.0 在 StatPearls 眼整形外科文本及影像考題上的表現。 Cureus 2024-12-18

這項研究評估了ChatGPT 3.5和4.0在眼整形相關問題的表現，分析了文字和圖像問題。結果顯示，ChatGPT-3.5正確回答56.85%的文字問題，而ChatGPT-4.0提升至73.46%，顯示出顯著的準確性提升。雖然ChatGPT-4.0在文字問題上表現更佳，但在圖像問題的準確率卻降至56.94%。這顯示出在醫學教育中，對大型語言模型的可靠性仍需進一步改進。 PubMed DOI

Chat GPT vs an experienced ophthalmologist: evaluating chatbot writing performance in ophthalmology.
Chat GPT 與經驗豐富的眼科醫師：評估聊天機器人在眼科寫作表現。 Eye (Lond) 2025-04-01

本研究評估了ChatGPT在眼科領域撰寫科學引言的能力，並與經驗豐富的眼科醫師進行比較。十位專家在不知情的情況下評估了ChatGPT和人類撰寫的引言，準確率為57.7%。錯誤分類率在不同子專科中差異顯著，眼整形的錯誤率最高。評估指標顯示，ChatGPT生成的引言與人類撰寫的並無顯著差異，近一半的引言無法區分。這顯示ChatGPT在眼科科學內容生成上有顯著進步，未來應探討其在學術寫作中的潛力與倫理影響。 PubMed DOI

Artificial Intelligence vs. Human Cognition: A Comparative Analysis of ChatGPT and Candidates Sitting the European Board of Ophthalmology Diploma Examination.
人工智慧與人類認知：ChatGPT 與參加歐洲眼科醫學會文憑考試考生的比較分析 Vision (Basel) 2025-04-23

這項研究發現，ChatGPT-3.5 Turbo在歐洲眼科醫學會考試的多重是非題表現不錯，平均得分64.4%，但在單一最佳答案題型只拿到28.4%，明顯輸給人類考生。它在資訊查找上較強，但知識整合能力較弱。整體來說，ChatGPT適合當作眼科考試準備和回饋的輔助工具。 PubMed DOI

Analysis of ChatGPT-4's performance on ophthalmology questions from the MIR exam.
ChatGPT-4 在 MIR 考試眼科題目上的表現分析 Arch Soc Esp Oftalmol (Engl Ed) 2025-05-11

研究發現，ChatGPT-4在回答西班牙MIR考試的眼科題目時，正確率高達90.2%，和眼科專業人員的答案一致率也有86.41%。在專業人員監督下，ChatGPT-4能有效協助解決臨床與理論問題，有助於提升病患照護流程。 PubMed DOI

原始文章

站上相關主題文章列表