Understanding Natural Language: Potential Application of Large Language Models to Ophthalmology.
理解自然語言：大型語言模型在眼科的潛在應用。 Asia Pac J Ophthalmol (Phila) 2024-07-26

大型語言模型（LLMs）是自然語言處理的前沿技術，透過深度學習模擬人類語言理解與生成。隨著變壓器架構的引入，LLMs在類人互動上展現出色的能力，特別是在醫療領域，能增強醫療人員與患者的溝通。這篇回顧探討了LLMs的演變及其在臨床應用的潛力，包括自動化醫療文檔、分診建議及個性化教育材料的創建。文章也提到LLMs的限制及解決方案，強調其在眼科等領域提升醫療服務質量的潛力。 PubMed DOI

A Qualitative Evaluation of ChatGPT4 and PaLM2's Response to Patient's Questions Regarding Age-Related Macular Degeneration.
對於患者關於年齡相關性黃斑變性問題的 ChatGPT4 和 PaLM2 回應的質性評估。 Diagnostics (Basel) 2024-07-27

這篇論文探討了兩個大型語言模型（LLMs），ChatGPT4 和 PaLM2，對於年齡相關黃斑變性（AMD）患者常見問題的回答效果。研究強調患者了解病情對於慢性疾病管理的重要性。從專注於 AMD 的網站整理了143個問題，並讓這兩個模型及三位眼科醫生回答。結果顯示，ChatGPT4 在臨床共識、潛在危害等方面表現優於 PaLM2，顯示出這些模型在患者教育上的潛力，但仍需謹慎使用，不能取代專業醫療建議。 PubMed DOI

The Ability of Large Language Models to Generate Patient Information Materials for Retinopathy of Prematurity: Evaluation of Readability, Accuracy, and Comprehensiveness.
大型語言模型生成早產兒視網膜病患者資訊材料的能力：可讀性、準確性和全面性的評估。 Turk J Ophthalmol 2025-01-02

這項研究評估了土耳其眼科協會針對早產兒視網膜病變的病患教育材料可讀性，並與大型語言模型（如GPT-4.0、GPT-4o mini和Gemini）生成的內容進行比較。結果顯示，TOA的材料可讀性超過六年級，而GPT-4.0和Gemini則更易讀。經調整後，GPT-4.0的可讀性改善，且在準確性和全面性上得分最高，Gemini則最低。研究指出，GPT-4.0在創建可及的病患教育材料上有潛力，但使用LLMs時需考慮地區醫療差異和資訊準確性。 PubMed DOI

Reader's digest version of scientific writing: comparative evaluation of summarization capacity between large language models and medical students in analyzing scientific writing in sleep medicine.
大型語言模型與醫學生在分析睡眠醫學科學寫作中的總結能力比較評估。 Front Artif Intell 2025-01-08

這項研究探討大型語言模型（LLMs）在總結睡眠醫學研究文章的效果，並與醫學生的摘要進行比較。19名醫學生評估了三個AI生成和三個人類生成的摘要，結果顯示兩者在可讀性和理解上無顯著差異（p值均大於0.2）。不過，研究也指出參與者人數少、可能的偏見及缺乏視覺輔助等限制。總體來看，AI生成的摘要與人類的相當，但仍需進一步研究以了解AI在醫學文獻總結中的優缺點。 PubMed DOI

Tailoring glaucoma education using large language models: Addressing health disparities in patient comprehension.
利用大型語言模型量身訂做青光眼教育：解決患者理解中的健康差異。 Medicine (Baltimore) 2025-01-10

這項研究評估了GPT-4在簡化醫學文獻的表現，目的是幫助病人更好理解青光眼護理。研究將62篇青光眼期刊摘要和9篇病人教育材料轉換為五年級的閱讀水平。結果顯示，摘要的可讀性顯著改善，FKGL平均下降3.21分，FKRE上升28.6分；病人教育材料的FKGL下降2.38分，FKRE上升12.14分。整體來看，GPT-4有效提升了青光眼相關資訊的可讀性，讓病人更容易理解。 PubMed DOI

Assessing the possibility of using large language models in ocular surface diseases.
評估大型語言模型在眼表疾病中的應用可能性。 Int J Ophthalmol 2025-01-20

這項研究評估了五個大型語言模型（LLMs）在回答眼表疾病相關問題的表現，包括ChatGPT-4、ChatGPT-3.5、Claude 2、PaLM2和SenseNova。研究團隊設計了100道單選題，涵蓋角膜炎等主題。結果顯示，ChatGPT-4的準確性和可信度最佳，成功率為59%，但仍有28%的錯誤率。PaLM2在答案準確性上表現良好，相關係數達0.8。整體而言，這些模型在醫學教育和臨床實踐中展現了潛力，特別是ChatGPT-4的表現尤為突出。 PubMed DOI

"Comparative analysis of large language models against the NHS 111 online triaging for emergency ophthalmology".
「大型語言模型與 NHS 111 線上急診眼科分診的比較分析」 Eye (Lond) 2025-01-21

這項研究評估了多種大型語言模型（LLMs）在處理眼科緊急情況的表現，並與英國國民健康服務（NHS）111的系統進行比較。研究涵蓋21個緊急情境問題，測試的模型包括ChatGPT-3.5、Google Bard、Bing Chat和ChatGPT-4.0。結果顯示，93%的LLM回應至少得分為「良好」，顯示它們提供的資訊正確且無重大錯誤。整體來看，這些模型在提供即時資訊和指導方面，顯示出作為有效工具的潛力，能提升患者護理及醫療可及性。 PubMed DOI

Advancing Ophthalmology With Large Language Models: Applications, Challenges, and Future Directions.
利用大型語言模型推進眼科學：應用、挑戰與未來方向。 Surv Ophthalmol 2025-03-03

近年來，人工智慧（AI）技術，特別是大型語言模型（LLMs）的進步，對傳統醫療實踐有著顯著影響，能提升醫療效率與品質。在眼科領域，LLMs 可協助醫生診斷眼疾、優化治療建議、簡化醫療紀錄撰寫，並提供教育支持。然而，LLMs 在臨床應用中仍面臨挑戰，如知識基礎限制、AI 幻覺現象，以及數據隱私問題。未來的研究將對克服這些挑戰並發揮 LLMs 的潛力至關重要。 PubMed DOI

Large Language Models in Ophthalmology: A Review of Publications from Top Ophthalmology Journals.
眼科中的大型語言模型：來自頂尖眼科期刊的出版物回顧。 Ophthalmol Sci 2025-03-21

這項研究回顧了大型語言模型（LLMs）在眼科的應用，特別是高排名期刊的相關文章，共分析了101篇研究，主要來自美國、英國和加拿大。研究指出，LLMs在醫學教育、臨床協助、研究及病人教育中有顯著貢獻，但也引發了對表現不一致、偏見及倫理問題的擔憂。作者強調持續改進AI的重要性，並呼籲建立倫理指導方針及跨學科合作，以應對這些挑戰，展現LLMs在眼科的潛力與限制。 PubMed DOI

Evaluating the Application of Artificial Intelligence and Ambient Listening to Generate Medical Notes in Vitreoretinal Clinic Encounters.
人工智慧與環境聆聽技術於玻璃體視網膜門診紀錄生成之應用評估 Clin Ophthalmol 2025-06-10

這項研究比較了 ChatGPT 3.5 和 Google Gemini 1.0 Pro 在生成視網膜門診紀錄的表現。結果顯示，ChatGPT 3.5 不論在轉錄準確度還是紀錄品質都優於 Gemini。不過，兩者偶爾還是會出現資訊錯誤。整體來說，這類 AI 有助減輕醫師紀錄負擔，但還需要再優化才能更安心使用。 PubMed DOI

原始文章

站上相關主題文章列表