原始文章

一項研究評估了聊天機器人GPT-4o和Gemini Advanced在視網膜疾病診斷的能力,分析了50個OCT/OCTA案例。結果顯示,ChatGPT-4o正確診斷了31個案例(62%),明顯優於Gemini Advanced的16個(p=0.0048)。Gemini Advanced在24%的案例中未能提供回應,且兩者都經常誤診黃斑水腫。ChatGPT-4o在外科視網膜問題和醫療視網膜疾病的診斷準確率較高。總體而言,ChatGPT-4o在影像診斷上表現更佳,但仍有改進空間。 PubMed DOI


站上相關主題文章列表

研究發現ChatGPT-4在眼科影像解釋上表現良好,準確率達70%,尤其擅長視網膜問題。在非影像問題上表現更佳,但在不同眼科領域的表現有差異。建議在醫學領域應適當整合這類聊天機器人,雖然在回答眼科問題方面有潛力,但在非影像問題上表現更出色。 PubMed DOI

研究比較了三個大型語言模型(ChatGPT-3.5、ChatGPT-4和Google Gemini)在分析視網膜脫落病例並提出手術計劃的表現。經過50個病例的分析後發現,ChatGPT-4與專家外科醫師的意見最接近,ChatGPT-3.5次之,Google Gemini表現最差。ChatGPT模型也獲得了比Google Gemini更高的全球品質分數。ChatGPT-4是唯一建議採用聯合晶體玻璃切割手術方法的模型。總體而言,ChatGPT模型提供了比Google Gemini更準確和精確的建議。 PubMed DOI

研究比較了三個AI聊天機器人(ChatGPT-3.5、Bing Copilot、Google Gemini)協助眼科醫師處理難題的效果,發現它們提供了有用資訊,但不及專家準確。ChatGPT回答較為一致。AI聊天機器人可輔助眼科診斷,但不可取代專家諮詢。 PubMed DOI

這項研究評估了兩個大型語言模型,ChatGPT-4 和 Google Gemini,針對視網膜脫落問題的可讀性和準確性。分析了13個不同難度的問題,並由十位專家評分。結果顯示,Google Gemini 較易理解,但 ChatGPT-4 在正確答案上表現更佳,尤其是困難問題。ChatGPT-4 在八個問題上優於 Google Gemini,且在簡單和困難問題上都獲得更高評分。整體而言,這兩個 AI 工具有效提供準確的醫療資訊,建議可增強醫療護理。 PubMed DOI

這項研究探討了先進的人工智慧模型,特別是ChatGPT和Google的Gemini AI,在眼科領域的應用潛力。研究比較了這些模型與眼科住院醫師的表現,使用了600道來自以色列住院醫師考試的問題。結果顯示,Gemini Advanced的準確率最高,達66%,其次是ChatGPT-4的62%。這項研究強調了AI在醫學教育中的輔助角色,並指出需要進一步改進,以提升其在不同子專科的有效性,對改善病人護理具有潛力。 PubMed DOI

這項研究評估了具視覺功能的GPT-4V在眼科診斷玻璃體視網膜疾病的表現。研究在巴斯科姆·帕爾默眼科診所進行,分析了2010年至2023年的病人數據。結果顯示,GPT-4V在開放式問題中的診斷準確率為13.7%,而多選題為31.3%。該模型能準確識別後玻璃體脫離等病症,但在開放式問題的有效性有限,顯示出提供複雜醫療建議的挑戰。總體而言,GPT-4V在臨床護理中仍有潛力。 PubMed DOI

在2023年9月,OpenAI推出了能分析圖像的GPT-4 Vision聊天機器人。一項研究測試了它在解讀神經眼科圖像的準確性,特別是Hess屏幕圖和自動視野圖。結果顯示,它在5道Hess問題中正確識別2道,在5道視野問題中正確識別3道。不過,質性分析指出它的解讀有缺陷,例如錯誤識別側別,並混淆生理盲點與中央暗點。總體來看,GPT-4 Vision在眼科圖像解讀上的表現不穩定,顯示其圖像識別能力仍需進一步提升。 PubMed DOI

這項研究探討了AI聊天機器人GPT-3.5和GPT-4.0在眼科門診註冊及診斷眼病的有效性。研究分析了208個臨床檔案,結果顯示: 1. **註冊建議**:GPT-3.5(63.5%)、GPT-4.0(77.9%)和住院醫師(69.2%)的準確性相似,無顯著差異。 2. **診斷準確性**:GPT-4.0和住院醫師在有病史及檢查的檔案中表現優於GPT-3.5。 3. **錯誤診斷**:GPT-4.0的錯誤診斷較少,顯示出精確度提升。 4. **整體表現**:GPT-4.0在鑑別診斷上接近住院醫師,顯示其潛在應用價值。 結論認為,AI聊天機器人有助於提升眼科病人註冊,但需進一步驗證其在診斷中的應用。 PubMed DOI

在眼科領域的研究中,OpenAI 的 ChatGPT 在回答病人常見問題上表現優於 Google 的 Bard (Gemini Pro)。一位資深眼科醫生選了 20 個問題,八位專家對回答進行評估,結果顯示 ChatGPT 在準確性、全面性和清晰度上均高於 Bard,分別得分 4.0、4.5 和 5.0,而 Bard 則為 3.0、3.0 和 4.0,差異具統計意義 (p < 0.001)。這顯示 AI 聊天機器人雖然能提供準確清晰的回答,但仍需進一步研究以提升其醫療工具的可靠性。 PubMed DOI

人工智慧在醫療,特別是眼科的影像分析上有顯著進展。最近,ChatGPT加入影像分析功能,開啟新的診斷可能性。本研究選取12張眼底影像,評估ChatGPT 4.0的診斷準確性。結果顯示,ChatGPT能準確診斷四種疾病,但在七個案例中表現不佳。雖然顯示出潛力,但目前準確性不足以應用於臨床,需進一步研究以提升其診斷能力。 PubMed DOI