Multi-Modal AI for Multi-Label Retinal Disease Prediction Using OCT and Fundus Images: A Hybrid Approach.
多模態 AI 結合 OCT 與眼底影像於多標籤視網膜疾病預測之混合式方法
Sensors (Basel) 2025-07-30
這篇論文提出 VisionTrack 多模態 AI 系統,能整合影像、臨床資料和醫療報告,提升視網膜疾病診斷的準確度。系統結合 CNN、GNN 和 LLM 技術,在公開資料集上測試表現優異,展現早期偵測和個人化眼科照護的應用潛力。
PubMedDOI♡
站上相關主題文章列表
Discriminative, generative artificial intelligence, and foundation models in retina imaging.
視網膜影像中的辨別性、生成性人工智慧及基礎模型。
Taiwan J Ophthalmol 2025-01-13
Multimodal machine learning enables AI chatbot to diagnose ophthalmic diseases and provide high-quality medical responses.
多模態機器學習使 AI 聊天機器人能夠診斷眼科疾病並提供高品質的醫療回應。
NPJ Digit Med 2025-01-27
Automated detection of retinal artery occlusion in fundus photography via self-supervised deep learning and multimodal interpretability using a multimodal AI chatbot.
透過自我監督深度學習和多模態可解釋性,利用多模態 AI 聊天機器人自動檢測眼底攝影中的視網膜動脈阻塞。
Med Biol Eng Comput 2025-03-31
Can off-the-shelf visual large language models detect and diagnose ocular diseases from retinal photographs?
現成的視覺大型語言模型能否從視網膜照片中檢測和診斷眼科疾病?
BMJ Open Ophthalmol 2025-04-07
Multimodal LLMs for retinal disease diagnosis via OCT: few-shot versus single-shot learning.
利用多模態大型語言模型(LLMs)透過OCT進行視網膜疾病診斷:少量學習(few-shot)與單次學習(single-shot)的比較
Ther Adv Ophthalmol 2025-05-22
這項研究發現,GPT-4o 和 Claude Sonnet 3.5 這兩款AI模型,經過少量範例訓練後,診斷OCT影像的準確率最高可達73%。雖然還不如專業深度學習模型,但在日常眼科診斷、特別是判斷正常個案時,已展現輔助潛力。未來需更多研究結合影像和臨床資料來提升表現。
PubMedDOI
Large language model-based multimodal system for detecting and grading ocular surface diseases from smartphone images.
基於大型語言模型的多模態系統,用於從智慧型手機影像檢測與分級眼表疾病
Front Cell Dev Biol 2025-06-09
這項研究開發的 MOSAIC AI 系統,能用手機拍的眼睛照片來偵測和分級眼表疾病,價格親民又容易理解。測試顯示,影像品質控管準確率有 95%,疾病偵測準確率 87%,分級表現也會隨訓練資料增加而提升。MOSAIC 有望幫助偏鄉或資源有限地區提升眼科照護。
PubMedDOI