A Qualitative Evaluation of ChatGPT4 and PaLM2's Response to Patient's Questions Regarding Age-Related Macular Degeneration.
對於患者關於年齡相關性黃斑變性問題的 ChatGPT4 和 PaLM2 回應的質性評估。 Diagnostics (Basel) 2024-07-27

這篇論文探討了兩個大型語言模型（LLMs），ChatGPT4 和 PaLM2，對於年齡相關黃斑變性（AMD）患者常見問題的回答效果。研究強調患者了解病情對於慢性疾病管理的重要性。從專注於 AMD 的網站整理了143個問題，並讓這兩個模型及三位眼科醫生回答。結果顯示，ChatGPT4 在臨床共識、潛在危害等方面表現優於 PaLM2，顯示出這些模型在患者教育上的潛力，但仍需謹慎使用，不能取代專業醫療建議。 PubMed DOI

Investigating the role of large language models on questions about refractive surgery.
探討大型語言模型在屈光手術相關問題中的角色。 Int J Med Inform 2025-01-09

這項研究評估了三個大型語言模型（LLMs）—ChatGPT-4.0、Google Gemini 和 Microsoft Copilot—在回答屈光手術相關問題的效果。兩位眼科醫生使用5點李克特量表評分25個常見問題的回答。結果顯示，ChatGPT-4.0的得分高於Microsoft Copilot，但與Google Gemini無顯著差異。根據DISCERN量表，ChatGPT-4.0的可靠性得分最高，但可讀性得分最低，顯示其答案對病人來說較為複雜。總體而言，ChatGPT-4.0提供了更準確的信息，但理解上較為困難。 PubMed DOI

Assessing the possibility of using large language models in ocular surface diseases.
評估大型語言模型在眼表疾病中的應用可能性。 Int J Ophthalmol 2025-01-20

這項研究評估了五個大型語言模型（LLMs）在回答眼表疾病相關問題的表現，包括ChatGPT-4、ChatGPT-3.5、Claude 2、PaLM2和SenseNova。研究團隊設計了100道單選題，涵蓋角膜炎等主題。結果顯示，ChatGPT-4的準確性和可信度最佳，成功率為59%，但仍有28%的錯誤率。PaLM2在答案準確性上表現良好，相關係數達0.8。整體而言，這些模型在醫學教育和臨床實踐中展現了潛力，特別是ChatGPT-4的表現尤為突出。 PubMed DOI

Evaluating the Accuracy and Readability of ChatGPT-4o's Responses to Patient-Based Questions about Keratoconus.
評估 ChatGPT-4o 對於有關圓錐角膜的病人問題的回應準確性和可讀性。 Ophthalmic Epidemiol 2025-03-28

這項研究評估了大型語言模型ChatGPT-4o對圓錐角膜相關問題的回答準確性與可讀性。研究中，兩位眼科醫生對ChatGPT-4o的30個回答進行評分，結果顯示平均準確性為4.48分，評分一致性良好。然而，回答的可讀性較高，SMOG分數為15.49，FKGL為14.95，FRE為27.41，顯示一般民眾理解上有困難。雖然ChatGPT-4o的回答準確，但語言複雜性可能影響理解，建議未來改進以提升可及性。 PubMed DOI

Performance of popular large language models in glaucoma patient education: A randomized controlled study.
流行大型語言模型在青光眼患者教育中的表現：一項隨機對照研究。 Adv Ophthalmol Pract Res 2025-03-31

這項研究探討了四個大型語言模型（LLMs）——Qwen、Baichuan 2、ChatGPT-4.0 和 PaLM 2——在教育青光眼患者的效果。資深眼科醫生評估這些模型對青光眼問題的回答，並用中文可讀性平台檢視其可讀性與難度。29位青光眼患者與這些聊天機器人互動，並與醫生一起評分，標準包括正確性、完整性、可讀性、有用性和安全性。結果顯示，Baichuan 2 和 ChatGPT-4.0 表現最佳，且兩者在患者和醫生評估中無顯著差異，結論認為這兩者是有效的青光眼教育工具。 PubMed DOI

ChatGPT-4 for addressing patient-centred frequently asked questions in age-related macular degeneration clinical practice.
ChatGPT-4 在以病人為中心的年齡相關性黃斑部病變臨床實務中，解答常見問題的應用 Eye (Lond) 2025-04-15

ChatGPT-4 回答 AMD 病患常見問題時，內容大致正確、連貫且安全，專家多給予正面評價。但還是有資訊過時或不夠完整的情況，所以目前不建議用來做 AMD 病患的日常或個人化衛教諮詢。 PubMed DOI

Evaluating the novel role of ChatGPT-4 in addressing corneal ulcer queries: An AI-powered insight.
ChatGPT-4 在解答角膜潰瘍相關問題中的新角色評估：AI 驅動的洞見 Eur J Ophthalmol 2025-04-28

這項研究發現，ChatGPT-4在回答角膜潰瘍相關問題時，對於危險因子、症狀和治療等主題表現不錯，但在分類、檢查和臨床徵象方面較弱。大多數答案被評為良好或可接受，但專家評分有些差異。整體來說，ChatGPT-4在眼科教育有潛力，但還需要加強準確度和一致性。 PubMed DOI

DeepSeekTM and lacrimal drainage disorders: hype or is it performing better than ChatGPTTM?
DeepSeekTM 與淚道疾病：炒作還是真比 ChatGPTTM 表現更好？ Orbit 2025-05-08

這項研究比較 DeepSeek™ 和 ChatGPT™ 在回答淚道疾病問題的表現，發現兩者正確率相近（DeepSeek™ 60%、ChatGPT™ 56%），都很少出現錯誤，也能自我修正。新版 ChatGPT™ 表現比舊版更好。整體來說，DeepSeek™ 和 ChatGPT™ 差不多，各有優勢，但若要應用在醫療領域，還需要更多專業訓練。 PubMed DOI

Evaluating the effectiveness of chatbots and traditional resources in patient education on dry eye disease.
評估聊天機器人與傳統資源於乾眼症患者衛教之成效 Clin Exp Optom 2025-06-26

AI聊天機器人（如ChatGPT-3.5、Gemini、Llama）提供的乾眼症資訊，正確度和易懂度跟美國眼科醫學會（AAO）官網差不多。Gemini說明最容易理解，AAO內容最容易閱讀。雖然AI回答語言較複雜，對部分病患來說可能較難懂，但整體資訊正確且安全。AI可作為病患衛教輔助，但不能取代醫師，未來應加強易讀性。 PubMed DOI

Evaluating Large Language Models in Ptosis-Related inquiries: A Cross-Lingual Study.
重語言模型於Ptosis相關問題的評估：一項跨語言研究 Transl Vis Sci Technol 2025-07-16

這項研究比較多種大型語言模型在回答眼瞼下垂相關問題的表現，發現GPT-4o在英文回答最優，Qwen2.5則在中文表現突出。雖然AI有助於病人衛教和醫師諮詢，但臨床應用前還需更多驗證和調整，顯示AI有提升多語言醫療溝通的潛力。 PubMed DOI

原始文章

站上相關主題文章列表