原始文章

這項研究用ChatGPT打造的聊天機器人,測試100個假設眼科急診案例,分級結果和三位資深眼科醫師高度一致(Cohen’s kappa約0.74–0.75),整體一致性也很高(Fleiss’ kappa = 0.79),和醫師表現沒顯著差異。顯示AI聊天機器人在眼科急診分級上,準確度可媲美專業醫師,有望成為急診分級的輔助工具。 PubMed DOI


站上相關主題文章列表

一項研究評估了聊天機器人GPT-4o和Gemini Advanced在視網膜疾病診斷的能力,分析了50個OCT/OCTA案例。結果顯示,ChatGPT-4o正確診斷了31個案例(62%),明顯優於Gemini Advanced的16個(p=0.0048)。Gemini Advanced在24%的案例中未能提供回應,且兩者都經常誤診黃斑水腫。ChatGPT-4o在外科視網膜問題和醫療視網膜疾病的診斷準確率較高。總體而言,ChatGPT-4o在影像診斷上表現更佳,但仍有改進空間。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在處理眼科緊急情況的表現,並與英國國民健康服務(NHS)111的系統進行比較。研究涵蓋21個緊急情境問題,測試的模型包括ChatGPT-3.5、Google Bard、Bing Chat和ChatGPT-4.0。結果顯示,93%的LLM回應至少得分為「良好」,顯示它們提供的資訊正確且無重大錯誤。整體來看,這些模型在提供即時資訊和指導方面,顯示出作為有效工具的潛力,能提升患者護理及醫療可及性。 PubMed DOI

這項研究評估了ChatGPT在分析葡萄膜黑色素瘤患者案例並提供治療建議的能力。研究回顧了40名患者的案例,發現ChatGPT的手術建議準確性為55%,排除眼球摘除後提高至75%。與三位專家的建議一致性分別為50%、55%和57%,在排除眼球摘除後則提升至70%至75%。雖然ChatGPT在簡單案例中表現不錯,但在處理更複雜的情況時仍有其限制,顯示出需要更全面的患者評估。 PubMed DOI

本研究評估了ChatGPT在分析青光眼患者案例及建議手術治療的能力。對60例手術案例進行回顧性分析,結果顯示ChatGPT的建議準確率為78%,在普通案例中表現良好,與專家建議相近。然而,在挑戰性案例中準確率下降至65%,顯示其在複雜情境下的局限性。總體而言,ChatGPT在普通案例中能提供合理的治療計畫,但在處理更具挑戰性的情況時仍需謹慎。 PubMed DOI

本研究評估了ChatGPT在眼科領域撰寫科學引言的能力,並與經驗豐富的眼科醫師進行比較。十位專家在不知情的情況下評估了ChatGPT和人類撰寫的引言,準確率為57.7%。錯誤分類率在不同子專科中差異顯著,眼整形的錯誤率最高。評估指標顯示,ChatGPT生成的引言與人類撰寫的並無顯著差異,近一半的引言無法區分。這顯示ChatGPT在眼科科學內容生成上有顯著進步,未來應探討其在學術寫作中的潛力與倫理影響。 PubMed DOI

這項研究評估了ChatGPT在急診環境中對眼部創傷的診斷及手術需求的有效性。分析了52個來自寧波眼科醫院的案例,使用GPT-3.5和GPT-4.0進行中英文分析,並結合眼部照片來評估表現。結果顯示,僅用文字的診斷準確率為GPT-3.5的80.77%-88.46%和GPT-4.0的94.23%-98.08%。但當加入圖像時,GPT-4.0的準確率降至63.46%。研究指出,雖然ChatGPT能協助急診醫生,但其對臨床圖像的理解能力仍需加強。 PubMed DOI

本研究評估了ChatGPT-4在眼科診所對病人訊息的分流效果,並與眼科住院醫師進行比較。分析139則訊息後,發現MD與GPT-4在診所建議上的一致性為64.7%,而在分流緊急性上為60.4%。GPT-4在93.5%的案例中提供的緊急性建議與MD相符或更早。結果顯示,GPT-4能支持醫生的判斷,減輕工作負擔,並改善病人護理,但無法完全取代醫生的角色。整合AI有助於提升服務質量與病人結果。 PubMed DOI

這項多中心研究發現,ChatGPT-4o在急診分級的表現整體優於人類分級人員,和急診專科醫師的判斷高度一致(kappa 0.833,F1 0.897)。不過,在醫學中心處理較複雜的急診個案時,ChatGPT的準確度會下降。總結來說,ChatGPT在大多數情境下都很準確,但遇到複雜病例還是有進步空間。 PubMed DOI

研究發現,ChatGPT-4在回答西班牙MIR考試的眼科題目時,正確率高達90.2%,和眼科專業人員的答案一致率也有86.41%。在專業人員監督下,ChatGPT-4能有效協助解決臨床與理論問題,有助於提升病患照護流程。 PubMed DOI

這項研究用22個神經眼科病例,比較ChatGPT(GPT-3.5和GPT-4)和兩位專科醫師的診斷能力。GPT-3.5正確率59%,GPT-4有82%,醫師則是86%。GPT-4的表現已經接近專科醫師,顯示AI有潛力協助診斷複雜眼腦疾病,尤其在缺乏專科醫師的地區。不過,臨床應用前還需要更多驗證安全性與可靠性。 PubMed DOI