Chatbots talk Strabismus: Can AI become the new patient Educator?
聊天機器人談斜視：人工智慧能成為新的病患教育者嗎？ Int J Med Inform 2024-08-19

斜視是常見的眼科疾病，病人教育對於知情決策很重要。本研究比較了三個AI聊天機器人（ChatGPT、Bard、Copilot）和一個可靠網站（AAPOS）在回答斜視相關問題的表現。結果顯示，AAPOS在準確性上表現最佳，其次是Bard、Copilot和ChatGPT。Bard在可理解性和可行性方面得分最高，而AAPOS則在可讀性上最容易理解。情感分析顯示，Bard和Copilot在病人教育上有潛力，但AAPOS在準確性和可讀性上仍優於這些聊天機器人。 PubMed DOI

A Performance Evaluation of Large Language Models in Keratoconus: A Comparative Study of ChatGPT-3.5, ChatGPT-4.0, Gemini, Copilot, Chatsonic, and Perplexity.
Keratoconus 中大型語言模型的性能評估：ChatGPT-3.5、ChatGPT-4.0、Gemini、Copilot、Chatsonic 和 Perplexity 的比較研究。 J Clin Med 2024-11-09

本研究評估了六款流行聊天機器人（ChatGPT-3.5、ChatGPT-4.0、Gemini、Copilot、Chatsonic 和 Perplexity）在提供圓錐角膜資訊的可靠性。使用 mDISCERN 和全球質量評分（GQS）指標進行評估，結果顯示大部分網站的責任性較低，且可讀性普遍偏高。Gemini 和 Copilot 的表現最佳，顯示出較高的可靠性和質量，但仍需改善以符合病人的健康素養需求。 PubMed DOI

Readability and Appropriateness of Responses Generated by ChatGPT 3.5, ChatGPT 4.0, Gemini, and Microsoft Copilot for FAQs in Refractive Surgery.
屈光手術常見問題中 ChatGPT 3.5、ChatGPT 4.0、Gemini 和 Microsoft Copilot 生成回應的可讀性與適當性。 Turk J Ophthalmol 2025-01-02

這項研究評估了四款大型語言模型（LLM）聊天機器人對屈光手術常見問題的回答適當性與可讀性。經驗豐富的屈光外科醫生評估了答案的正確性，並用五種指標測量可讀性。結果顯示，ChatGPT 3.5 正確率為 45%，ChatGPT 4.0 為 52.5%，Gemini 表現最佳，達 87.5%，Copilot 則為 60%。所有機器人的可讀性都很困難，理解需具大學學位。儘管如此，Gemini 提供的答案最為適當，且可讀性較佳。總體而言，這些聊天機器人仍可能產生不當回應，且閱讀上有挑戰。 PubMed DOI

Evaluation of the Usability of ChatGPT-4 and Google Gemini in Patient Education About Rhinosinusitis.
關於鼻竇炎患者教育中 ChatGPT-4 和 Google Gemini 可用性的評估。 Clin Otolaryngol 2025-01-08

這項研究評估了AI聊天機器人ChatGPT-4和Google Gemini在鼻竇炎患者教育的有效性。研究人員提出109個問題，涵蓋一般知識、診斷、治療、手術和併發症，並由專業耳鼻喉科醫生評估回答。結果顯示，ChatGPT-4在診斷方面表現優異，獲得滿分，而Google Gemini在治療類別中則有較多不準確的回答。整體來看，ChatGPT-4在準確性和全面性上明顯優於Google Gemini。 PubMed DOI

Artificial Doctors: Performance of Chatbots as a Tool for Patient Education on Keratoconus.
人工醫生：聊天機器人在角膜圓錐症患者教育中的表現。 Eye Contact Lens 2025-01-09

這項研究評估了 ChatGPT、Bard 和 Copilot 在回答圓錐角膜患者問題的效果，並與美國眼科學會（AAO）網站進行比較。研究分析了二十個問題的準確性、可理解性、可行性和可讀性。結果顯示，Bard 在準確性和可理解性上表現最佳，超過了 ChatGPT、Copilot 和 AAO 網站；而 Bard 和 ChatGPT 的回應在可行性上也優於 AAO 網站，但 AAO 的可讀性得分較高。整體而言，研究指出聊天機器人能有效支持圓錐角膜患者教育，可能減少不必要的就診，並提升患者認知。 PubMed DOI

Assessing chatbots ability to produce leaflets on cataract surgery: Bing AI, chatGPT 3.5, chatGPT 4o, ChatSonic, Google Bard, Perplexity and Pi.
評估聊天機器人製作白內障手術宣傳單的能力：Bing AI、chatGPT 3.5、chatGPT 4、ChatSonic、Google Bard、Perplexity 和 Pi。 J Cataract Refract Surg 2025-01-31

這項研究評估了七款熱門聊天機器人生成的白內障手術病人資訊手冊的品質，包括Bing AI、ChatGPT 3.5、ChatGPT 4、ChatSonic、Google Bard、Perplexity和Pi。研究發現，ChatSonic的回應品質最佳，其次是Bing AI和Perplexity，而ChatGPT 3.5的表現最差，還包含錯誤資訊。Bing AI、ChatSonic和Perplexity提供了可靠的參考資料，顯示出在醫療資訊提供上，聊天機器人的品質和可靠性差異明顯，特別是ChatSonic在眼科病人教育方面的潛力。 PubMed DOI

Evaluating the Efficacy of Artificial Intelligence-Driven Chatbots in Addressing Queries on Vernal Conjunctivitis.
評估人工智慧驅動的聊天機器人在解答春季結膜炎相關問題上的效能。 Cureus 2025-03-31

春季角結膜炎（VKC）是一種常見的過敏性眼病，病人教育對於管理此病至關重要。研究評估了 Google Gemini Advanced 聊天機器人在回答與 VKC 相關問題的準確性和可靠性。結果顯示，該 AI 工具的回應準確率高達86.4%，且評估者間一致性良好（Cronbach's alpha = 0.92）。雖然在一般查詢中表現優異，但在複雜治療指導上仍需改進。總體而言，Google Gemini Advanced 是一個可靠的病人教育工具，但專家監督仍然重要，未來需進一步研究以提升其臨床應用能力。 PubMed DOI

Evaluating Large Language Models in Addressing Patient Questions on Endodontic Pain: A Comparative Analysis of accessible chatbots.
可及性聊天機器人在回應病患牙髓疼痛問題之表現評估：大型語言模型的比較分析 J Endod 2025-05-07

這項研究發現，ChatGPT 3.5回答牙髓病痛問題時，內容較完整可靠，但用詞偏難懂；Gemini則較易讀，但資訊不夠完整、可靠性較低。總結來說，AI雖能輔助衛教，仍需專業人員把關，確保資訊正確又好懂。 PubMed DOI

Artificial intelligence versus ophthalmology experts: Comparative analysis of responses to blepharitis patient queries.
人工智慧與眼科專家：對於睑緣炎患者提問的回應之比較分析 Eur J Ophthalmol 2025-06-16

眼科醫師能針對眼瞼炎提供最專業的診斷與建議，特別是複雜個案。AI像GPT-4o等雖能回答基本問題，但遇到細節或特殊情況就有限。AI適合用來輔助衛教，但不能取代醫師的臨床判斷。 PubMed DOI

Large Language Models Use in Dry Eye Disease: Perplexity AI versus ChatGPT4.
大型語言模型在乾眼症中的應用：Perplexity AI 與 ChatGPT4 之比較 Semin Ophthalmol 2025-08-19

ChatGPT4 和 Perplexity AI 回答乾眼症常見問題的表現差不多，整體品質中等，各方面分數也有落差。ChatGPT4 在提出研究點子上稍微優秀。這兩款 AI 也許能在門診協助病患衛教，但還是需要專家把關，且在研究點子或文獻搜尋方面都不太可靠。 PubMed DOI

原始文章

站上相關主題文章列表