原始文章

最近生成式人工智慧的進展,特別是像GPT-4 V這樣的多模態模型,顯示出在分析視覺和文本數據方面的潛力,對醫療保健,尤其是眼科,可能帶來重大影響。本研究評估了GPT-4 V在診斷眼部疾病的能力,結果顯示提供臨床背景能顯著提升診斷準確性。沒有背景時,GPT-4 V的正確率為47.5%,有背景時提升至67.5%。這顯示GPT-4 V能有效整合視覺與文本信息,對改善眼科病患護理有潛力。 PubMed DOI


站上相關主題文章列表

研究發現GPT-4在回答複雜臨床眼科案例問題時,診斷和處理能力中等準確,尤其在正確診斷後的處理更準確。雖然接近眼科醫師水準,但不及資深醫師。建議改進提示策略,GPT-4或許可應用於醫學決策和診斷。 PubMed DOI

研究發現,GPT-4在眼科領域表現優異,得到眼科醫師認可。這顯示先進語言模型在提供醫療建議上有潛力,尤其在眼科專家有限的情況下。 PubMed DOI

研究評估了基於GPT-4V的聊天機器人在解釋眼科條件的眼部多模態影像表現。測試結果顯示在準確性、可用性和安全性方面表現不盡相同。雖然在燈裂影像表現不錯,但眼底攝影表現較差。總體而言,聊天機器人能正確識別影像模式,但在病變檢測、診斷和決策支持方面有待提升。研究結論指出,GPT-4V尚不適用於眼科臨床決策,並提出改進多模態模型的建議。 PubMed DOI

這項研究評估了具視覺功能的GPT-4V在眼科診斷玻璃體視網膜疾病的表現。研究在巴斯科姆·帕爾默眼科診所進行,分析了2010年至2023年的病人數據。結果顯示,GPT-4V在開放式問題中的診斷準確率為13.7%,而多選題為31.3%。該模型能準確識別後玻璃體脫離等病症,但在開放式問題的有效性有限,顯示出提供複雜醫療建議的挑戰。總體而言,GPT-4V在臨床護理中仍有潛力。 PubMed DOI

這項研究評估了ChatGPT 3.5和4.0版本在診斷青光眼方面的能力,使用了眼壓治療研究的數據。研究涵蓋1585名受試者的3170隻眼睛,並將臨床參數轉換為文本進行分析。結果顯示,ChatGPT 3.5的準確率為66%,而4.0則提升至87%。雖然4.0的整體準確率較高,但3.5在檢測青光眼的敏感性上表現更佳。這顯示ChatGPT在評估眼壓高的眼病上具有潛力,未來的多模態模型可能進一步提升診斷準確性。 PubMed DOI

這項研究評估了ChatGPT在眼科臨床評估中的表現,目的是檢視其準確性及眼科醫生是否能辨識其生成的回應。研究中,16位眼科醫生參與,ChatGPT在17個案例中準確識別了15個主要診斷(88.2%)。醫生們在13個案例中以77.9%的準確率辨識出回應作者,信心評分為3.6。醫生指出ChatGPT的回應較為一般,常有不相關資訊及句法模式。結論認為,雖然ChatGPT顯示潛力,但在臨床應用前仍需進一步評估。 PubMed DOI

這項研究探討了AI聊天機器人GPT-3.5和GPT-4.0在眼科門診註冊及診斷眼病的有效性。研究分析了208個臨床檔案,結果顯示: 1. **註冊建議**:GPT-3.5(63.5%)、GPT-4.0(77.9%)和住院醫師(69.2%)的準確性相似,無顯著差異。 2. **診斷準確性**:GPT-4.0和住院醫師在有病史及檢查的檔案中表現優於GPT-3.5。 3. **錯誤診斷**:GPT-4.0的錯誤診斷較少,顯示出精確度提升。 4. **整體表現**:GPT-4.0在鑑別診斷上接近住院醫師,顯示其潛在應用價值。 結論認為,AI聊天機器人有助於提升眼科病人註冊,但需進一步驗證其在診斷中的應用。 PubMed DOI

這項研究比較了AI模型GPT-4o與人類眼科醫生在青光眼診斷上的表現。研究在一所三級眼科醫療中心進行,分析了26個青光眼病例。結果顯示,GPT-4o在主要診斷的準確性上較低,得分5.500,經驗最豐富的醫生得分8.038。在完整性方面,GPT-4o得分3.077,低於B醫生的3.615。不過,在鑑別診斷上,GPT-4o的表現與醫生相當,得分7.577。研究認為,GPT-4o雖然尚未成為獨立診斷工具,但在臨床上可作為輔助工具,未來AI的進步可能會提升其有效性。 PubMed DOI

這項研究探討了多模態大型語言模型(LLMs),特別是GPT-4o和Claude Sonnet 3.5,如何結合文本與視覺資訊進行醫療診斷。研究在120個臨床案例中進行測試,結果顯示在只有文本的情況下,GPT-4o的準確率為70.8%,遠超醫生的39.5%。當加入圖片時,所有參與者的表現都有提升,尤其是醫生的準確率增幅最明顯。GPT-4o在有圖片的情況下達到84.5%,而醫生則為78.8%。這顯示LLMs在視覺數據處理上仍需加強,以達到人類醫生的表現。 PubMed DOI

這項研究評估了流行的視覺大型語言模型(VLLMs),特別是OpenAI的GPT-4V和Google的Gemini,對於從視網膜影像中識別眼病的表現。研究使用了44張來自新加坡眼病流行病學研究的視網膜照片。結果顯示,GPT-4V在預設模式下的檢測準確率最高,達97.1%,但所有模型在提供診斷描述的質量上普遍較差。研究強調了專業VLLMs在醫療領域的必要性,以及人類監督在臨床眼科中的重要性。 PubMed DOI