原始文章

眼科醫師能針對眼瞼炎提供最專業的診斷與建議,特別是複雜個案。AI像GPT-4o等雖能回答基本問題,但遇到細節或特殊情況就有限。AI適合用來輔助衛教,但不能取代醫師的臨床判斷。 PubMed DOI


站上相關主題文章列表

研究比較了三個AI聊天機器人(ChatGPT-3.5、Bing Copilot、Google Gemini)協助眼科醫師處理難題的效果,發現它們提供了有用資訊,但不及專家準確。ChatGPT回答較為一致。AI聊天機器人可輔助眼科診斷,但不可取代專家諮詢。 PubMed DOI

這項研究探討了先進的人工智慧模型,特別是ChatGPT和Google的Gemini AI,在眼科領域的應用潛力。研究比較了這些模型與眼科住院醫師的表現,使用了600道來自以色列住院醫師考試的問題。結果顯示,Gemini Advanced的準確率最高,達66%,其次是ChatGPT-4的62%。這項研究強調了AI在醫學教育中的輔助角色,並指出需要進一步改進,以提升其在不同子專科的有效性,對改善病人護理具有潛力。 PubMed DOI

在眼科領域的研究中,OpenAI 的 ChatGPT 在回答病人常見問題上表現優於 Google 的 Bard (Gemini Pro)。一位資深眼科醫生選了 20 個問題,八位專家對回答進行評估,結果顯示 ChatGPT 在準確性、全面性和清晰度上均高於 Bard,分別得分 4.0、4.5 和 5.0,而 Bard 則為 3.0、3.0 和 4.0,差異具統計意義 (p < 0.001)。這顯示 AI 聊天機器人雖然能提供準確清晰的回答,但仍需進一步研究以提升其醫療工具的可靠性。 PubMed DOI

本研究評估四種大型語言模型(LLMs)在回答內眼炎病人問題的準確性、可靠性和可讀性。兩位眼科醫生使用五點李克特量表評估25個問題的回答,並用DISCERN量表測量可靠性,Flesch可讀性指數和Flesch-Kincaid年級水平評估可讀性。結果顯示,A-Eye Consult和ChatGPT-4.0的回答比Google Gemini和Copilot更全面且準確,且兩者的得分顯著高於後者。結論是,A-Eye Consult和ChatGPT-4.0在可靠性和準確性上優於其他模型。 PubMed DOI

這項研究評估了ChatGPT在回答上眼瞼整形手術常見問題的表現,並與人類眼面整形外科醫生的回答進行比較。結果顯示,ChatGPT在準確性(3.8)和全面性(3.6)上表現較好,而OPS在準確性(3.6)和個人回答相似性(2.9)上稍遜。雖然兩者在準確性和相似性上無顯著差異,但ChatGPT在全面性上明顯優於OPS。這顯示ChatGPT可作為患者教育的輔助工具,但仍需專業醫師的指導以保障患者安全。 PubMed DOI

這項研究比較了三種人工智慧語言模型—GPT-3.5、GPT-4o 和 Gemini—在提供甲狀腺眼病(TED)患者資訊的有效性。結果顯示,GPT-3.5的表現最佳,正確性得分5.75,可靠性得分5.68,特別在治療和手術選項上表現突出。GPT-4o和Gemini的得分較低,分別為5.32和5.10。研究認為,GPT-3.5是提供TED資訊的最佳選擇,建議臨床醫師在患者教育中使用。 PubMed DOI

這項研究比較了GPT-4和眼科醫生對眼科手術問題的回應可讀性。研究隨機選取200個問題,發現GPT-4使用的複雜詞彙比例較高(24.42%),而醫生則為17.76%。兩者的平均句子字數相似,但GPT-4的回應被評為更高的年級水平,顯示其內容較複雜。兩者都需至少12年級的教育才能理解,超過了國立衛生研究院建議的六到七年級水平。這強調了健康資訊可及性的重要性,尤其是AI工具在患者教育中的應用。 PubMed DOI

春季角結膜炎(VKC)是一種常見的過敏性眼病,病人教育對於管理此病至關重要。研究評估了 Google Gemini Advanced 聊天機器人在回答與 VKC 相關問題的準確性和可靠性。結果顯示,該 AI 工具的回應準確率高達86.4%,且評估者間一致性良好(Cronbach's alpha = 0.92)。雖然在一般查詢中表現優異,但在複雜治療指導上仍需改進。總體而言,Google Gemini Advanced 是一個可靠的病人教育工具,但專家監督仍然重要,未來需進一步研究以提升其臨床應用能力。 PubMed DOI

這項研究發現,ChatGPT-4在回答角膜潰瘍相關問題時,對於危險因子、症狀和治療等主題表現不錯,但在分類、檢查和臨床徵象方面較弱。大多數答案被評為良好或可接受,但專家評分有些差異。整體來說,ChatGPT-4在眼科教育有潛力,但還需要加強準確度和一致性。 PubMed DOI

這項研究發現,ChatGPT回答眼瞼手術常見問題時,內容大致正確且有幫助,但用詞偏高中程度,部分病患可能覺得難懂。不同問題類型的可讀性差不多。總結來說,ChatGPT能提供實用資訊,但答案不一定完全正確,也未必人人都看得懂。 PubMed DOI