Retinal Imaging Analysis Performed By ChatGPT-4o And Gemini Advanced: The Turning Point Of The Revolution?
ChatGPT-4o 和 Gemini Advanced 進行的視網膜影像分析：革命的轉折點？ Retina 2024-12-23

一項研究評估了聊天機器人GPT-4o和Gemini Advanced在視網膜疾病診斷的能力，分析了50個OCT/OCTA案例。結果顯示，ChatGPT-4o正確診斷了31個案例（62%），明顯優於Gemini Advanced的16個（p=0.0048）。Gemini Advanced在24%的案例中未能提供回應，且兩者都經常誤診黃斑水腫。ChatGPT-4o在外科視網膜問題和醫療視網膜疾病的診斷準確率較高。總體而言，ChatGPT-4o在影像診斷上表現更佳，但仍有改進空間。 PubMed DOI

"Comparative analysis of large language models against the NHS 111 online triaging for emergency ophthalmology".
「大型語言模型與 NHS 111 線上急診眼科分診的比較分析」 Eye (Lond) 2025-01-21

這項研究評估了多種大型語言模型（LLMs）在處理眼科緊急情況的表現，並與英國國民健康服務（NHS）111的系統進行比較。研究涵蓋21個緊急情境問題，測試的模型包括ChatGPT-3.5、Google Bard、Bing Chat和ChatGPT-4.0。結果顯示，93%的LLM回應至少得分為「良好」，顯示它們提供的資訊正確且無重大錯誤。整體來看，這些模型在提供即時資訊和指導方面，顯示出作為有效工具的潛力，能提升患者護理及醫療可及性。 PubMed DOI

Artificial intelligence with ChatGPT 4: a large language model in support of ocular oncology cases.
人工智慧與 ChatGPT 4：大型語言模型在眼科腫瘤病例中的支持。 Int Ophthalmol 2025-02-07

這項研究評估了ChatGPT在分析葡萄膜黑色素瘤患者案例並提供治療建議的能力。研究回顧了40名患者的案例，發現ChatGPT的手術建議準確性為55%，排除眼球摘除後提高至75%。與三位專家的建議一致性分別為50%、55%和57%，在排除眼球摘除後則提升至70%至75%。雖然ChatGPT在簡單案例中表現不錯，但在處理更複雜的情況時仍有其限制，顯示出需要更全面的患者評估。 PubMed DOI

Testing the Reliability of ChatGPT Assistance for Surgical Choices in Challenging Glaucoma Cases.
測試 ChatGPT 在挑戰性青光眼病例中對手術選擇的輔助可靠性。 J Pers Med 2025-03-26

本研究評估了ChatGPT在分析青光眼患者案例及建議手術治療的能力。對60例手術案例進行回顧性分析，結果顯示ChatGPT的建議準確率為78%，在普通案例中表現良好，與專家建議相近。然而，在挑戰性案例中準確率下降至65%，顯示其在複雜情境下的局限性。總體而言，ChatGPT在普通案例中能提供合理的治療計畫，但在處理更具挑戰性的情況時仍需謹慎。 PubMed DOI

Chat GPT vs an experienced ophthalmologist: evaluating chatbot writing performance in ophthalmology.
Chat GPT 與經驗豐富的眼科醫師：評估聊天機器人在眼科寫作表現。 Eye (Lond) 2025-04-01

本研究評估了ChatGPT在眼科領域撰寫科學引言的能力，並與經驗豐富的眼科醫師進行比較。十位專家在不知情的情況下評估了ChatGPT和人類撰寫的引言，準確率為57.7%。錯誤分類率在不同子專科中差異顯著，眼整形的錯誤率最高。評估指標顯示，ChatGPT生成的引言與人類撰寫的並無顯著差異，近一半的引言無法區分。這顯示ChatGPT在眼科科學內容生成上有顯著進步，未來應探討其在學術寫作中的潛力與倫理影響。 PubMed DOI

Evaluating multimodal ChatGPT for emergency decision-making of ocular trauma cases.
評估多模態 ChatGPT 在眼外傷案例緊急決策中的應用。 Front Cell Dev Biol 2025-04-11

這項研究評估了ChatGPT在急診環境中對眼部創傷的診斷及手術需求的有效性。分析了52個來自寧波眼科醫院的案例，使用GPT-3.5和GPT-4.0進行中英文分析，並結合眼部照片來評估表現。結果顯示，僅用文字的診斷準確率為GPT-3.5的80.77%-88.46%和GPT-4.0的94.23%-98.08%。但當加入圖像時，GPT-4.0的準確率降至63.46%。研究指出，雖然ChatGPT能協助急診醫生，但其對臨床圖像的理解能力仍需加強。 PubMed DOI

Triage of Patient Messages Sent to the Eye Clinic via the Electronic Medical Record: A Comparative Study on AI and Human Triage Performance.
透過電子病歷發送至眼科的病人訊息分流：AI與人類分流表現的比較研究。 J Clin Med 2025-04-12

本研究評估了ChatGPT-4在眼科診所對病人訊息的分流效果，並與眼科住院醫師進行比較。分析139則訊息後，發現MD與GPT-4在診所建議上的一致性為64.7%，而在分流緊急性上為60.4%。GPT-4在93.5%的案例中提供的緊急性建議與MD相符或更早。結果顯示，GPT-4能支持醫生的判斷，減輕工作負擔，並改善病人護理，但無法完全取代醫生的角色。整合AI有助於提升服務質量與病人結果。 PubMed DOI

ChatGPT-supported patient triage with voice commands in the emergency department: A prospective multicenter study.
急診部門以語音指令輔助 ChatGPT 進行病患分診：一項前瞻性多中心研究 Am J Emerg Med 2025-04-24

這項多中心研究發現，ChatGPT-4o在急診分級的表現整體優於人類分級人員，和急診專科醫師的判斷高度一致（kappa 0.833，F1 0.897）。不過，在醫學中心處理較複雜的急診個案時，ChatGPT的準確度會下降。總結來說，ChatGPT在大多數情境下都很準確，但遇到複雜病例還是有進步空間。 PubMed DOI

Analysis of ChatGPT-4's performance on ophthalmology questions from the MIR exam.
ChatGPT-4 在 MIR 考試眼科題目上的表現分析 Arch Soc Esp Oftalmol (Engl Ed) 2025-05-11

研究發現，ChatGPT-4在回答西班牙MIR考試的眼科題目時，正確率高達90.2%，和眼科專業人員的答案一致率也有86.41%。在專業人員監督下，ChatGPT-4能有效協助解決臨床與理論問題，有助於提升病患照護流程。 PubMed DOI

ChatGPT Assisting Diagnosis of Neuro-Ophthalmology Diseases Based on Case Reports.
基於病例報告，ChatGPT 協助診斷神經眼科疾病 J Neuroophthalmol 2025-08-20

這項研究用22個神經眼科病例，比較ChatGPT（GPT-3.5和GPT-4）和兩位專科醫師的診斷能力。GPT-3.5正確率59%，GPT-4有82%，醫師則是86%。GPT-4的表現已經接近專科醫師，顯示AI有潛力協助診斷複雜眼腦疾病，尤其在缺乏專科醫師的地區。不過，臨床應用前還需要更多驗證安全性與可靠性。 PubMed DOI

原始文章

站上相關主題文章列表