原始文章

現有像ChatGPT-4o這類AI模型,在診斷老年性黃斑部病變時,表現還是比不上眼科醫師。不過,研究團隊透過專門設計的訓練課程,開發出RetinaVLM-Specialist,讓它在分期和轉診上表現已經追上資淺醫師,甚至比其他AI更準確。專家也認同這種課程式訓練,能讓AI更貼近臨床需求。 PubMed DOI


站上相關主題文章列表

最近在視網膜影像的人工智慧(AI)方面有兩大進展:判別性AI和生成性AI。判別性任務中,卷積神經網絡(CNN)仍是主流,但視覺變壓器(ViT)因其在糖尿病視網膜病變篩檢等任務中的優異表現,逐漸受到重視。生成性方面,生成對抗網絡(GAN)則用於創建新影像,幫助解決數據不平衡問題。儘管AI技術快速進步,但在實際應用上仍有距離,需更多證據證明其能有效預防視力喪失。 PubMed DOI

最近生成式人工智慧的進展,特別是像GPT-4 V這樣的多模態模型,顯示出在分析視覺和文本數據方面的潛力,對醫療保健,尤其是眼科,可能帶來重大影響。本研究評估了GPT-4 V在診斷眼部疾病的能力,結果顯示提供臨床背景能顯著提升診斷準確性。沒有背景時,GPT-4 V的正確率為47.5%,有背景時提升至67.5%。這顯示GPT-4 V能有效整合視覺與文本信息,對改善眼科病患護理有潛力。 PubMed DOI

近年來,人工智慧(AI)技術,特別是大型語言模型(LLMs)的進步,對傳統醫療實踐有著顯著影響,能提升醫療效率與品質。在眼科領域,LLMs 可協助醫生診斷眼疾、優化治療建議、簡化醫療紀錄撰寫,並提供教育支持。然而,LLMs 在臨床應用中仍面臨挑戰,如知識基礎限制、AI 幻覺現象,以及數據隱私問題。未來的研究將對克服這些挑戰並發揮 LLMs 的潛力至關重要。 PubMed DOI

這項研究評估了流行的視覺大型語言模型(VLLMs),特別是OpenAI的GPT-4V和Google的Gemini,對於從視網膜影像中識別眼病的表現。研究使用了44張來自新加坡眼病流行病學研究的視網膜照片。結果顯示,GPT-4V在預設模式下的檢測準確率最高,達97.1%,但所有模型在提供診斷描述的質量上普遍較差。研究強調了專業VLLMs在醫療領域的必要性,以及人類監督在臨床眼科中的重要性。 PubMed DOI

這項研究發現,GPT-4在診斷複雜眼科病例時,如果只有圖片沒文字,準確率會明顯下降;但有圖片說明時,表現就會提升。整體來說,GPT-4的表現和部分眼科醫師差不多,但還不及最頂尖的專家。顯示它目前在眼科影像判讀上還有進步空間,但未來有潛力成為臨床輔助工具。 PubMed DOI

這項研究比較GPT-4、GPT-4V和GPT-4o三種AI在眼科診斷題的表現,發現多模態的GPT-4o準確率最高(77.1%),明顯優於其他模型,也比一般大眾好。結果顯示,結合圖片能大幅提升AI診斷能力,多模態AI在醫療應用上很有潛力。 PubMed DOI

這項研究發現,GPT-4o 和 Claude Sonnet 3.5 這兩款AI模型,經過少量範例訓練後,診斷OCT影像的準確率最高可達73%。雖然還不如專業深度學習模型,但在日常眼科診斷、特別是判斷正常個案時,已展現輔助潛力。未來需更多研究結合影像和臨床資料來提升表現。 PubMed DOI

這項研究發現,GPT-4.o 在診斷角膜疾病的準確率最高(80%),但還是比不上人類角膜專科醫師(92.5%)。雖然 GPT-4.o 等大型語言模型有潛力,但在複雜病例上表現不穩定,目前只能當作輔助工具,臨床決策還是得靠專家判斷。 PubMed DOI

這項研究比較了 ChatGPT 3.5 和 Google Gemini 1.0 Pro 在生成視網膜門診紀錄的表現。結果顯示,ChatGPT 3.5 不論在轉錄準確度還是紀錄品質都優於 Gemini。不過,兩者偶爾還是會出現資訊錯誤。整體來說,這類 AI 有助減輕醫師紀錄負擔,但還需要再優化才能更安心使用。 PubMed DOI

這項研究比較ChatGPT-3.5、ChatGPT-4和Gemini在產生早產兒視網膜病變衛教資料的表現。三款AI都能產出正確、易懂的內容,但ChatGPT-4在將資料改寫成國中一年級程度時,品質和可靠性最好。整體來說,ChatGPT-4特別適合協助家長取得高品質、易讀的衛教資訊。 PubMed DOI