原始文章

這項研究探討了先進的人工智慧模型,特別是ChatGPT和Google的Gemini AI,在眼科領域的應用潛力。研究比較了這些模型與眼科住院醫師的表現,使用了600道來自以色列住院醫師考試的問題。結果顯示,Gemini Advanced的準確率最高,達66%,其次是ChatGPT-4的62%。這項研究強調了AI在醫學教育中的輔助角色,並指出需要進一步改進,以提升其在不同子專科的有效性,對改善病人護理具有潛力。 PubMed DOI


站上相關主題文章列表

這項研究評估了兩個ChatGPT模型(GPT-3.5和GPT-4)以及專業的眼科醫生在回答眼科問題時的表現。GPT-4在大多數類別中表現優於GPT-3.5和人類專業人士,顯示出更高的準確性。研究結果表明,像GPT-4這樣的先進對話式人工智慧系統可能是醫學教育和實踐中有價值的工具。 PubMed DOI

研究比較了ChatGPT-3.5和ChatGPT-4.0在眼科病例上的表現,結果顯示ChatGPT-4.0在神經眼科病例中表現更好。ChatGPT-4.0處理圖像和簡單問題更出色,回答也更為簡潔。研究指出像ChatGPT-4.0這樣的人工智慧模型對提升眼科診斷和醫學教育有潛力。 PubMed DOI

研究比較了ChatGPT-3.5和ChatGPT-4.0在回答眼科問題時的表現。結果顯示,GPT-4.0比GPT-3.5好,但兩者在準確性上有限制,尤其是面對複雜問題時。雖然ChatGPT有潛力,但要成為眼科教育工具,仍需進一步改進。 PubMed DOI

研究比較了三個大型語言模型(ChatGPT-3.5、ChatGPT-4和Google Gemini)在分析視網膜脫落病例並提出手術計劃的表現。經過50個病例的分析後發現,ChatGPT-4與專家外科醫師的意見最接近,ChatGPT-3.5次之,Google Gemini表現最差。ChatGPT模型也獲得了比Google Gemini更高的全球品質分數。ChatGPT-4是唯一建議採用聯合晶體玻璃切割手術方法的模型。總體而言,ChatGPT模型提供了比Google Gemini更準確和精確的建議。 PubMed DOI

研究比較了ChatGPT-4和Google Gemini在分析青光眼病例描述及提出手術計劃的表現。ChatGPT-4在與專家一致性和回應品質方面表現較佳,尤其在複雜病例中。兩者常建議小梁切除術。總體而言,ChatGPT-4在分析青光眼手術病例方面表現良好,Google Gemini則在回答問題上有限制。 PubMed DOI

研究比較了ChatGPT 3.5、Microsoft Bing和Google Gemini在神經眼科病例診斷上的表現。ChatGPT 3.5在準確性和適用性方面優於Microsoft Bing和Google Gemini,顯示AI模型在提升醫學教育和眼科診斷上有潛力。 PubMed DOI

對於早產兒視網膜病變(ROP)相關問題,經評估後發現ChatGPT-4表現最好,回答最準確可靠;BingAI和Gemini在不同方面也有優勢。ChatGPT-4雖然用詞較複雜,但提供詳盡可信賴的回答。總括而言,這些模型通常提供正確資訊。 PubMed DOI

研究比較了三個AI聊天機器人(ChatGPT-3.5、Bing Copilot、Google Gemini)協助眼科醫師處理難題的效果,發現它們提供了有用資訊,但不及專家準確。ChatGPT回答較為一致。AI聊天機器人可輔助眼科診斷,但不可取代專家諮詢。 PubMed DOI

這項研究評估了先進大型語言模型(LLMs)在醫學考試中的視覺能力,特別是GPT-4和Google的Gemini。研究比較了它們在台灣專科醫師考試(肺部與重症醫學)的表現,並以僅處理文本的GPT-3.5為基準。結果顯示,GPT-4的表現持續優於Gemini和GPT-3.5,經常超過60的及格門檻,接近人類考生的水準。相對而言,Gemini的表現較低,而GPT-3.5得分最低,顯示出新模型在解讀複雜醫療資訊方面的優勢。 PubMed DOI

這項研究評估了兩個大型語言模型,ChatGPT-4 和 Google Gemini,針對視網膜脫落問題的可讀性和準確性。分析了13個不同難度的問題,並由十位專家評分。結果顯示,Google Gemini 較易理解,但 ChatGPT-4 在正確答案上表現更佳,尤其是困難問題。ChatGPT-4 在八個問題上優於 Google Gemini,且在簡單和困難問題上都獲得更高評分。整體而言,這兩個 AI 工具有效提供準確的醫療資訊,建議可增強醫療護理。 PubMed DOI