原始文章

這項研究發現,GPT-4o 和 Claude Sonnet 3.5 這兩款AI模型,經過少量範例訓練後,診斷OCT影像的準確率最高可達73%。雖然還不如專業深度學習模型,但在日常眼科診斷、特別是判斷正常個案時,已展現輔助潛力。未來需更多研究結合影像和臨床資料來提升表現。 PubMed DOI


站上相關主題文章列表

研究測試了ChatGPT-4在未經訓練下,辨識青光眼的能力,結果顯示準確率達90%,敏感度50%,特異度94.44%。顯示先進AI技術在眼科等醫學領域有潛力,或許能省時省力,提供新診斷工具,特別對資源不足的環境有幫助。 PubMed DOI

這項研究評估了具視覺功能的GPT-4V在眼科診斷玻璃體視網膜疾病的表現。研究在巴斯科姆·帕爾默眼科診所進行,分析了2010年至2023年的病人數據。結果顯示,GPT-4V在開放式問題中的診斷準確率為13.7%,而多選題為31.3%。該模型能準確識別後玻璃體脫離等病症,但在開放式問題的有效性有限,顯示出提供複雜醫療建議的挑戰。總體而言,GPT-4V在臨床護理中仍有潛力。 PubMed DOI

這項研究比較了AI模型GPT-4o與人類眼科醫生在青光眼診斷上的表現。研究在一所三級眼科醫療中心進行,分析了26個青光眼病例。結果顯示,GPT-4o在主要診斷的準確性上較低,得分5.500,經驗最豐富的醫生得分8.038。在完整性方面,GPT-4o得分3.077,低於B醫生的3.615。不過,在鑑別診斷上,GPT-4o的表現與醫生相當,得分7.577。研究認為,GPT-4o雖然尚未成為獨立診斷工具,但在臨床上可作為輔助工具,未來AI的進步可能會提升其有效性。 PubMed DOI

人工智慧在醫療,特別是眼科的影像分析上有顯著進展。最近,ChatGPT加入影像分析功能,開啟新的診斷可能性。本研究選取12張眼底影像,評估ChatGPT 4.0的診斷準確性。結果顯示,ChatGPT能準確診斷四種疾病,但在七個案例中表現不佳。雖然顯示出潛力,但目前準確性不足以應用於臨床,需進一步研究以提升其診斷能力。 PubMed DOI

這項研究探討了多模態大型語言模型(LLMs),特別是GPT-4o和Claude Sonnet 3.5,如何結合文本與視覺資訊進行醫療診斷。研究在120個臨床案例中進行測試,結果顯示在只有文本的情況下,GPT-4o的準確率為70.8%,遠超醫生的39.5%。當加入圖片時,所有參與者的表現都有提升,尤其是醫生的準確率增幅最明顯。GPT-4o在有圖片的情況下達到84.5%,而醫生則為78.8%。這顯示LLMs在視覺數據處理上仍需加強,以達到人類醫生的表現。 PubMed DOI

最近生成式人工智慧的進展,特別是像GPT-4 V這樣的多模態模型,顯示出在分析視覺和文本數據方面的潛力,對醫療保健,尤其是眼科,可能帶來重大影響。本研究評估了GPT-4 V在診斷眼部疾病的能力,結果顯示提供臨床背景能顯著提升診斷準確性。沒有背景時,GPT-4 V的正確率為47.5%,有背景時提升至67.5%。這顯示GPT-4 V能有效整合視覺與文本信息,對改善眼科病患護理有潛力。 PubMed DOI

這項研究評估了流行的視覺大型語言模型(VLLMs),特別是OpenAI的GPT-4V和Google的Gemini,對於從視網膜影像中識別眼病的表現。研究使用了44張來自新加坡眼病流行病學研究的視網膜照片。結果顯示,GPT-4V在預設模式下的檢測準確率最高,達97.1%,但所有模型在提供診斷描述的質量上普遍較差。研究強調了專業VLLMs在醫療領域的必要性,以及人類監督在臨床眼科中的重要性。 PubMed DOI

這項研究發現,GPT-4在診斷複雜眼科病例時,如果只有圖片沒文字,準確率會明顯下降;但有圖片說明時,表現就會提升。整體來說,GPT-4的表現和部分眼科醫師差不多,但還不及最頂尖的專家。顯示它目前在眼科影像判讀上還有進步空間,但未來有潛力成為臨床輔助工具。 PubMed DOI

這項研究比較GPT-4、GPT-4V和GPT-4o三種AI在眼科診斷題的表現,發現多模態的GPT-4o準確率最高(77.1%),明顯優於其他模型,也比一般大眾好。結果顯示,結合圖片能大幅提升AI診斷能力,多模態AI在醫療應用上很有潛力。 PubMed DOI

這項研究發現,GPT-4.o 在診斷角膜疾病的準確率最高(80%),但還是比不上人類角膜專科醫師(92.5%)。雖然 GPT-4.o 等大型語言模型有潛力,但在複雜病例上表現不穩定,目前只能當作輔助工具,臨床決策還是得靠專家判斷。 PubMed DOI