Discriminative, generative artificial intelligence, and foundation models in retina imaging.
視網膜影像中的辨別性、生成性人工智慧及基礎模型。 Taiwan J Ophthalmol 2025-01-13

最近在視網膜影像的人工智慧（AI）方面有兩大進展：判別性AI和生成性AI。判別性任務中，卷積神經網絡（CNN）仍是主流，但視覺變壓器（ViT）因其在糖尿病視網膜病變篩檢等任務中的優異表現，逐漸受到重視。生成性方面，生成對抗網絡（GAN）則用於創建新影像，幫助解決數據不平衡問題。儘管AI技術快速進步，但在實際應用上仍有距離，需更多證據證明其能有效預防視力喪失。 PubMed DOI

Artificial Intelligence for Optical Coherence Tomography in Glaucoma.
青光眼中光學相干斷層掃描的人工智慧應用。 Transl Vis Sci Technol 2025-01-24

人工智慧（AI）與深度學習（DL）結合光學相干斷層掃描（OCT），在青光眼的診斷和管理上取得了顯著進展。研究指出，卷積神經網絡（CNNs）在視網膜層分割和青光眼損傷識別上特別有效，而遞迴神經網絡（RNNs）則擅長追蹤疾病進展。生成對抗網絡（GANs）能提升影像質量，自編碼器則有助於特徵提取。儘管如此，數據可用性和偏見等挑戰仍需克服，以便在臨床上成功應用這些技術，進而實現更精確的青光眼治療。 PubMed DOI

Multimodal machine learning enables AI chatbot to diagnose ophthalmic diseases and provide high-quality medical responses.
多模態機器學習使 AI 聊天機器人能夠診斷眼科疾病並提供高品質的醫療回應。 NPJ Digit Med 2025-01-27

這項研究探討了使用ChatGPT驅動的智能眼科多模態互動診斷系統（IOMIDS），幫助患者自我診斷和分診。IOMIDS結合文字輸入及來自裂隙燈和智慧型手機的影像數據，評估病史並診斷眼科疾病。研究在三個醫療中心進行，涵蓋10個子專科和50種疾病，分析了15,640個數據。結果顯示，文字加智慧型手機的模型達到最高診斷準確率，顯示基於聊天機器人的人工智慧在眼科自我診斷和分診上有潛力。該臨床試驗已註冊於NCT05930444。 PubMed DOI

Integrated visual and text-based analysis of ophthalmology clinical cases using a large language model.
使用大型語言模型進行眼科臨床案例的整合視覺與文本分析。 Sci Rep 2025-02-10

最近生成式人工智慧的進展，特別是像GPT-4 V這樣的多模態模型，顯示出在分析視覺和文本數據方面的潛力，對醫療保健，尤其是眼科，可能帶來重大影響。本研究評估了GPT-4 V在診斷眼部疾病的能力，結果顯示提供臨床背景能顯著提升診斷準確性。沒有背景時，GPT-4 V的正確率為47.5%，有背景時提升至67.5%。這顯示GPT-4 V能有效整合視覺與文本信息，對改善眼科病患護理有潛力。 PubMed DOI

Artificial intelligence-enhanced retinal imaging as a biomarker for systemic diseases.
人工智慧增強的視網膜影像作為全身疾病的生物標記。 Theranostics 2025-03-17

視網膜影像提供了一種非侵入性的方法，能夠觀察眼睛中的血管和神經纖維，並透過眼科組學深入了解全身健康。近期研究探討視網膜生物標記與多種全身性疾病的關聯，並結合人工智慧（AI）提升疾病檢測的潛力。數位彩色眼底攝影、光學相干斷層掃描（OCT）等技術被應用於篩檢和早期檢測。儘管AI展現潛力，但在數據質量和技術實施上仍面臨挑戰。這篇綜述旨在成為研究人員和臨床醫生的資源，促進AI在臨床的應用。 PubMed DOI

Automated detection of retinal artery occlusion in fundus photography via self-supervised deep learning and multimodal interpretability using a multimodal AI chatbot.
透過自我監督深度學習和多模態可解釋性，利用多模態 AI 聊天機器人自動檢測眼底攝影中的視網膜動脈阻塞。 Med Biol Eng Comput 2025-03-31

這項研究提出了一種創新的AI方法，利用眼底影像檢測視網膜動脈阻塞（RAO），首次將深度學習應用於此病症。研究者採用自我監督學習框架，並透過SimCLR克服標記數據不足的問題。經過預訓練的ResNet50模型在兩個外部數據集上顯示出高達0.924和0.988的診斷準確率，展現其穩健性。此外，研究還引入了一個基於ChatGPT-4的AI聊天機器人，結合Grad-CAM技術，提供模型預測的詳細解釋，幫助醫生理解決策過程，增進信任。這個AI模型有助於早期識別眼部及全身血管風險，強調了眼底影像在心血管風險評估中的潛力。 PubMed DOI

Can off-the-shelf visual large language models detect and diagnose ocular diseases from retinal photographs?
現成的視覺大型語言模型能否從視網膜照片中檢測和診斷眼科疾病？ BMJ Open Ophthalmol 2025-04-07

這項研究評估了流行的視覺大型語言模型（VLLMs），特別是OpenAI的GPT-4V和Google的Gemini，對於從視網膜影像中識別眼病的表現。研究使用了44張來自新加坡眼病流行病學研究的視網膜照片。結果顯示，GPT-4V在預設模式下的檢測準確率最高，達97.1%，但所有模型在提供診斷描述的質量上普遍較差。研究強調了專業VLLMs在醫療領域的必要性，以及人類監督在臨床眼科中的重要性。 PubMed DOI

Multimodal Performance of GPT-4 in Complex Ophthalmology Cases.
GPT-4 在複雜眼科病例中的多模態表現 J Pers Med 2025-04-25

這項研究發現，GPT-4在診斷複雜眼科病例時，如果只有圖片沒文字，準確率會明顯下降；但有圖片說明時，表現就會提升。整體來說，GPT-4的表現和部分眼科醫師差不多，但還不及最頂尖的專家。顯示它目前在眼科影像判讀上還有進步空間，但未來有潛力成為臨床輔助工具。 PubMed DOI

Multimodal LLMs for retinal disease diagnosis via OCT: few-shot versus single-shot learning.
利用多模態大型語言模型（LLMs）透過OCT進行視網膜疾病診斷：少量學習（few-shot）與單次學習（single-shot）的比較 Ther Adv Ophthalmol 2025-05-22

這項研究發現，GPT-4o 和 Claude Sonnet 3.5 這兩款AI模型，經過少量範例訓練後，診斷OCT影像的準確率最高可達73%。雖然還不如專業深度學習模型，但在日常眼科診斷、特別是判斷正常個案時，已展現輔助潛力。未來需更多研究結合影像和臨床資料來提升表現。 PubMed DOI

Large language model-based multimodal system for detecting and grading ocular surface diseases from smartphone images.
基於大型語言模型的多模態系統，用於從智慧型手機影像檢測與分級眼表疾病 Front Cell Dev Biol 2025-06-09

這項研究開發的 MOSAIC AI 系統，能用手機拍的眼睛照片來偵測和分級眼表疾病，價格親民又容易理解。測試顯示，影像品質控管準確率有 95%，疾病偵測準確率 87%，分級表現也會隨訓練資料增加而提升。MOSAIC 有望幫助偏鄉或資源有限地區提升眼科照護。 PubMed DOI

原始文章

站上相關主題文章列表