Artificial Intelligence in Ophthalmology: A Comparative Analysis of GPT-3.5, GPT-4, and Human Expertise in Answering StatPearls Questions.
眼科學中的人工智慧：對比分析 GPT-3.5、GPT-4 和人類專業知識在回答 StatPearls 問題中的表現。 Cureus 2023-07-25

這項研究評估了兩個ChatGPT模型（GPT-3.5和GPT-4）以及專業的眼科醫生在回答眼科問題時的表現。GPT-4在大多數類別中表現優於GPT-3.5和人類專業人士，顯示出更高的準確性。研究結果表明，像GPT-4這樣的先進對話式人工智慧系統可能是醫學教育和實踐中有價值的工具。 PubMed DOI

Evaluating the Artificial Intelligence Performance Growth in Ophthalmic Knowledge.
評估眼科知識中人工智慧表現的成長。 Cureus 2023-10-31

研究比較了ChatGPT-3.5和ChatGPT-4.0在眼科病例上的表現，結果顯示ChatGPT-4.0在神經眼科病例中表現更好。ChatGPT-4.0處理圖像和簡單問題更出色，回答也更為簡潔。研究指出像ChatGPT-4.0這樣的人工智慧模型對提升眼科診斷和醫學教育有潛力。 PubMed DOI

Evaluating ChatGPT on Orbital and Oculofacial Disorders: Accuracy and Readability Insights.
評估 ChatGPT 在眼眶和眼面疾病上的準確性和易讀性見解。 Ophthalmic Plast Reconstr Surg 2024-03-04

研究發現ChatGPT 4.0在眼科問題回答上表現優秀，專家高度肯定。這個模型適合大學生或研究生使用，具有高可靠性和複雜性。雖然在眼科教育和臨床應用有潛力，但仍需提升準確性和涵蓋範圍，特別是在視覺數據解釋方面。 PubMed DOI

Performance of ChatGPT on Ophthalmology-Related Questions Across Various Examination Levels: Observational Study.
ChatGPT 在不同考試水平上對眼科相關問題的表現：觀察性研究。 JMIR Med Educ 2024-02-04

研究比較了ChatGPT-3.5和ChatGPT-4.0在回答眼科問題時的表現。結果顯示，GPT-4.0比GPT-3.5好，但兩者在準確性上有限制，尤其是面對複雜問題時。雖然ChatGPT有潛力，但要成為眼科教育工具，仍需進一步改進。 PubMed DOI

Reliability and accuracy of artificial intelligence ChatGPT in providing information on ophthalmic diseases and management to patients.
人工智慧 ChatGPT 在提供眼科疾病和治療信息給患者方面的可靠性和準確性。 Eye (Lond) 2024-01-20

研究評估AI聊天機器人(ChatGPT)在眼科領域提供資訊的準確性，結果顯示77.5%回答得分≥1，但有22.5%回答≤-1，部分可能有害建議。ChatGPT可作為患者教育工具，但資訊目前不完整或不正確，仍需人類醫療監督。 PubMed DOI

Accuracy of an Artificial Intelligence Chatbot's Interpretation of Clinical Ophthalmic Images.
人工智慧聊天機器人對臨床眼科影像解讀的準確性。 JAMA Ophthalmol 2024-03-03

研究發現ChatGPT-4在眼科影像解釋上表現良好，準確率達70%，尤其擅長視網膜問題。在非影像問題上表現更佳，但在不同眼科領域的表現有差異。建議在醫學領域應適當整合這類聊天機器人，雖然在回答眼科問題方面有潛力，但在非影像問題上表現更出色。 PubMed DOI

Unveiling the clinical incapabilities: a benchmarking study of GPT-4V(ision) for ophthalmic multimodal image analysis.
揭示臨床無法力：GPT-4V(ision)用於眼科多模態影像分析的基準研究。 Br J Ophthalmol 2024-05-24

研究評估了基於GPT-4V的聊天機器人在解釋眼科條件的眼部多模態影像表現。測試結果顯示在準確性、可用性和安全性方面表現不盡相同。雖然在燈裂影像表現不錯，但眼底攝影表現較差。總體而言，聊天機器人能正確識別影像模式，但在病變檢測、診斷和決策支持方面有待提升。研究結論指出，GPT-4V尚不適用於眼科臨床決策，並提出改進多模態模型的建議。 PubMed DOI

Analysis of ChatGPT Responses to Ophthalmic Cases: Can ChatGPT Think like an Ophthalmologist?
ChatGPT 對眼科案例的回應分析：ChatGPT 能像眼科醫生一樣思考嗎？ Ophthalmol Sci 2024-09-30

這項研究評估了ChatGPT在眼科臨床評估中的表現，目的是檢視其準確性及眼科醫生是否能辨識其生成的回應。研究中，16位眼科醫生參與，ChatGPT在17個案例中準確識別了15個主要診斷（88.2%）。醫生們在13個案例中以77.9%的準確率辨識出回應作者，信心評分為3.6。醫生指出ChatGPT的回應較為一般，常有不相關資訊及句法模式。結論認為，雖然ChatGPT顯示潛力，但在臨床應用前仍需進一步評估。 PubMed DOI

Performance of Chatgpt in ophthalmology exam; human versus AI.
眼科考試中 Chatgpt 的表現；人類與 AI 的比較。 Int Ophthalmol 2024-11-06

這項研究評估了ChatGPT在回答「住院醫師訓練發展考試」問題的表現，並與眼科住院醫師進行比較。ChatGPT回答75個問題中正確37個，成功率53.62%。不同主題表現差異大，晶狀體與白內障準確率最高（77.77%），小兒眼科與斜視最低（0.00%）。789名住院醫師整體準確率50.37%，隨年級提升而增加。ChatGPT在住院醫師中排名第292位，且隨問題難度增加準確率下降。其回答可讀性較低，顯示內容難以理解。總體來看，ChatGPT表現不如三年級住院醫師，但未來可能隨數據增多而改善。 PubMed DOI

Performance of ChatGPT in Ophthalmic Registration and Clinical Diagnosis: Cross-Sectional Study.
ChatGPT 在眼科註冊和臨床診斷中的表現：橫斷面研究。 J Med Internet Res 2024-11-14

這項研究探討了AI聊天機器人GPT-3.5和GPT-4.0在眼科門診註冊及診斷眼病的有效性。研究分析了208個臨床檔案，結果顯示： 1. **註冊建議**：GPT-3.5（63.5%）、GPT-4.0（77.9%）和住院醫師（69.2%）的準確性相似，無顯著差異。 2. **診斷準確性**：GPT-4.0和住院醫師在有病史及檢查的檔案中表現優於GPT-3.5。 3. **錯誤診斷**：GPT-4.0的錯誤診斷較少，顯示出精確度提升。 4. **整體表現**：GPT-4.0在鑑別診斷上接近住院醫師，顯示其潛在應用價值。結論認為，AI聊天機器人有助於提升眼科病人註冊，但需進一步驗證其在診斷中的應用。 PubMed DOI

原始文章

站上相關主題文章列表