Discriminative, generative artificial intelligence, and foundation models in retina imaging.
視網膜影像中的辨別性、生成性人工智慧及基礎模型。 Taiwan J Ophthalmol 2025-01-13

最近在視網膜影像的人工智慧（AI）方面有兩大進展：判別性AI和生成性AI。判別性任務中，卷積神經網絡（CNN）仍是主流，但視覺變壓器（ViT）因其在糖尿病視網膜病變篩檢等任務中的優異表現，逐漸受到重視。生成性方面，生成對抗網絡（GAN）則用於創建新影像，幫助解決數據不平衡問題。儘管AI技術快速進步，但在實際應用上仍有距離，需更多證據證明其能有效預防視力喪失。 PubMed DOI

Integrated visual and text-based analysis of ophthalmology clinical cases using a large language model.
使用大型語言模型進行眼科臨床案例的整合視覺與文本分析。 Sci Rep 2025-02-10

最近生成式人工智慧的進展，特別是像GPT-4 V這樣的多模態模型，顯示出在分析視覺和文本數據方面的潛力，對醫療保健，尤其是眼科，可能帶來重大影響。本研究評估了GPT-4 V在診斷眼部疾病的能力，結果顯示提供臨床背景能顯著提升診斷準確性。沒有背景時，GPT-4 V的正確率為47.5%，有背景時提升至67.5%。這顯示GPT-4 V能有效整合視覺與文本信息，對改善眼科病患護理有潛力。 PubMed DOI

Advancing Ophthalmology With Large Language Models: Applications, Challenges, and Future Directions.
利用大型語言模型推進眼科學：應用、挑戰與未來方向。 Surv Ophthalmol 2025-03-03

近年來，人工智慧（AI）技術，特別是大型語言模型（LLMs）的進步，對傳統醫療實踐有著顯著影響，能提升醫療效率與品質。在眼科領域，LLMs 可協助醫生診斷眼疾、優化治療建議、簡化醫療紀錄撰寫，並提供教育支持。然而，LLMs 在臨床應用中仍面臨挑戰，如知識基礎限制、AI 幻覺現象，以及數據隱私問題。未來的研究將對克服這些挑戰並發揮 LLMs 的潛力至關重要。 PubMed DOI

Can off-the-shelf visual large language models detect and diagnose ocular diseases from retinal photographs?
現成的視覺大型語言模型能否從視網膜照片中檢測和診斷眼科疾病？ BMJ Open Ophthalmol 2025-04-07

這項研究評估了流行的視覺大型語言模型（VLLMs），特別是OpenAI的GPT-4V和Google的Gemini，對於從視網膜影像中識別眼病的表現。研究使用了44張來自新加坡眼病流行病學研究的視網膜照片。結果顯示，GPT-4V在預設模式下的檢測準確率最高，達97.1%，但所有模型在提供診斷描述的質量上普遍較差。研究強調了專業VLLMs在醫療領域的必要性，以及人類監督在臨床眼科中的重要性。 PubMed DOI

Multimodal Performance of GPT-4 in Complex Ophthalmology Cases.
GPT-4 在複雜眼科病例中的多模態表現 J Pers Med 2025-04-25

這項研究發現，GPT-4在診斷複雜眼科病例時，如果只有圖片沒文字，準確率會明顯下降；但有圖片說明時，表現就會提升。整體來說，GPT-4的表現和部分眼科醫師差不多，但還不及最頂尖的專家。顯示它目前在眼科影像判讀上還有進步空間，但未來有潛力成為臨床輔助工具。 PubMed DOI

Image Recognition Performance of GPT-4V(ision) and GPT-4o in Ophthalmology: Use of Images in Clinical Questions.
GPT-4V(ision) 與 GPT-4o 在眼科影像辨識的表現：臨床問題中影像應用之探討 Clin Ophthalmol 2025-05-13

這項研究比較GPT-4、GPT-4V和GPT-4o三種AI在眼科診斷題的表現，發現多模態的GPT-4o準確率最高（77.1%），明顯優於其他模型，也比一般大眾好。結果顯示，結合圖片能大幅提升AI診斷能力，多模態AI在醫療應用上很有潛力。 PubMed DOI

Multimodal LLMs for retinal disease diagnosis via OCT: few-shot versus single-shot learning.
利用多模態大型語言模型（LLMs）透過OCT進行視網膜疾病診斷：少量學習（few-shot）與單次學習（single-shot）的比較 Ther Adv Ophthalmol 2025-05-22

這項研究發現，GPT-4o 和 Claude Sonnet 3.5 這兩款AI模型，經過少量範例訓練後，診斷OCT影像的準確率最高可達73%。雖然還不如專業深度學習模型，但在日常眼科診斷、特別是判斷正常個案時，已展現輔助潛力。未來需更多研究結合影像和臨床資料來提升表現。 PubMed DOI

Diagnostic Performance of Publicly Available Large Language Models in Corneal Diseases: A Comparison with Human Specialists.
公開大型語言模型在角膜疾病診斷表現之評估：與人類專科醫師的比較 Diagnostics (Basel) 2025-05-28

這項研究發現，GPT-4.o 在診斷角膜疾病的準確率最高（80%），但還是比不上人類角膜專科醫師（92.5%）。雖然 GPT-4.o 等大型語言模型有潛力，但在複雜病例上表現不穩定，目前只能當作輔助工具，臨床決策還是得靠專家判斷。 PubMed DOI

Evaluating the Application of Artificial Intelligence and Ambient Listening to Generate Medical Notes in Vitreoretinal Clinic Encounters.
人工智慧與環境聆聽技術於玻璃體視網膜門診紀錄生成之應用評估 Clin Ophthalmol 2025-06-10

這項研究比較了 ChatGPT 3.5 和 Google Gemini 1.0 Pro 在生成視網膜門診紀錄的表現。結果顯示，ChatGPT 3.5 不論在轉錄準確度還是紀錄品質都優於 Gemini。不過，兩者偶爾還是會出現資訊錯誤。整體來說，這類 AI 有助減輕醫師紀錄負擔，但還需要再優化才能更安心使用。 PubMed DOI

Implementing Generative AI to Enhance Patient Education on Retinopathy of Prematurity.
運用生成式 AI 提升早產兒視網膜病變患者教育 J Pediatr Ophthalmol Strabismus 2025-06-26

這項研究比較ChatGPT-3.5、ChatGPT-4和Gemini在產生早產兒視網膜病變衛教資料的表現。三款AI都能產出正確、易懂的內容，但ChatGPT-4在將資料改寫成國中一年級程度時，品質和可靠性最好。整體來說，ChatGPT-4特別適合協助家長取得高品質、易讀的衛教資訊。 PubMed DOI

原始文章

站上相關主題文章列表