Comparing the Ability of Google and ChatGPT to Accurately Respond to Oculoplastics-Related Patient Questions and Generate Customized Oculoplastics Patient Education Materials.
比較 Google 和 ChatGPT 在準確回答眼整形相關病人問題及生成客製化眼整形病人教育材料的能力。 Clin Ophthalmol 2024-09-26

這項研究比較了Google和ChatGPT在回答眼部整形手術常見問題的準確性和可讀性，並評估ChatGPT製作客製化病患教育材料的能力。結果顯示，ChatGPT的回答可讀性較高，平均年級水平為15.6，顯著高於Google的10.0。準確性方面，ChatGPT達93%，也優於Google的78%。此外，ChatGPT能有效調整內容至較低的閱讀水平，仍保持準確性。總體來看，ChatGPT在提供準確資訊和病患教育方面展現出良好潛力，有助於提升病患對眼科護理的理解。 PubMed DOI

A Performance Evaluation of Large Language Models in Keratoconus: A Comparative Study of ChatGPT-3.5, ChatGPT-4.0, Gemini, Copilot, Chatsonic, and Perplexity.
Keratoconus 中大型語言模型的性能評估：ChatGPT-3.5、ChatGPT-4.0、Gemini、Copilot、Chatsonic 和 Perplexity 的比較研究。 J Clin Med 2024-11-09

本研究評估了六款流行聊天機器人（ChatGPT-3.5、ChatGPT-4.0、Gemini、Copilot、Chatsonic 和 Perplexity）在提供圓錐角膜資訊的可靠性。使用 mDISCERN 和全球質量評分（GQS）指標進行評估，結果顯示大部分網站的責任性較低，且可讀性普遍偏高。Gemini 和 Copilot 的表現最佳，顯示出較高的可靠性和質量，但仍需改善以符合病人的健康素養需求。 PubMed DOI

Examining the competence of artificial intelligence programs in neuro-ophthalmological disorders and analyzing their comparative superiority.
檢視人工智慧程式在神經眼科疾病中的能力及分析其比較優越性。 Oman J Ophthalmol 2024-12-09

這項研究評估了三款人工智慧聊天機器人—ChatGPT、Bing 和 Bard—在神經眼科疾病方面的知識。研究使用了美國眼科醫學會2022-2023年神經眼科書籍中的40個問題，結果顯示：ChatGPT的正確率為52.5%、Bing為55%、Bard為65%。統計分析顯示它們之間的表現差異不顯著（P = 0.489）。雖然這些AI能快速提供資訊，但回答不一定準確，因此使用時需謹慎。 PubMed DOI

Artificial Doctors: Performance of Chatbots as a Tool for Patient Education on Keratoconus.
人工醫生：聊天機器人在角膜圓錐症患者教育中的表現。 Eye Contact Lens 2025-01-09

這項研究評估了 ChatGPT、Bard 和 Copilot 在回答圓錐角膜患者問題的效果，並與美國眼科學會（AAO）網站進行比較。研究分析了二十個問題的準確性、可理解性、可行性和可讀性。結果顯示，Bard 在準確性和可理解性上表現最佳，超過了 ChatGPT、Copilot 和 AAO 網站；而 Bard 和 ChatGPT 的回應在可行性上也優於 AAO 網站，但 AAO 的可讀性得分較高。整體而言，研究指出聊天機器人能有效支持圓錐角膜患者教育，可能減少不必要的就診，並提升患者認知。 PubMed DOI

Assessing chatbots ability to produce leaflets on cataract surgery: Bing AI, chatGPT 3.5, chatGPT 4o, ChatSonic, Google Bard, Perplexity and Pi.
評估聊天機器人製作白內障手術宣傳單的能力：Bing AI、chatGPT 3.5、chatGPT 4、ChatSonic、Google Bard、Perplexity 和 Pi。 J Cataract Refract Surg 2025-01-31

這項研究評估了七款熱門聊天機器人生成的白內障手術病人資訊手冊的品質，包括Bing AI、ChatGPT 3.5、ChatGPT 4、ChatSonic、Google Bard、Perplexity和Pi。研究發現，ChatSonic的回應品質最佳，其次是Bing AI和Perplexity，而ChatGPT 3.5的表現最差，還包含錯誤資訊。Bing AI、ChatSonic和Perplexity提供了可靠的參考資料，顯示出在醫療資訊提供上，聊天機器人的品質和可靠性差異明顯，特別是ChatSonic在眼科病人教育方面的潛力。 PubMed DOI

Accuracy and Readability of ChatGPT Responses to Patient-Centric Strabismus Questions.
ChatGPT 對以患者為中心的斜視問題的回答準確性和可讀性。 J Pediatr Ophthalmol Strabismus 2025-02-19

這項研究評估了ChatGPT在斜視醫療方面的準確性與可讀性，使用了免費版（3.5）和付費版（4.0）。共提出34個問題，並在加州和佛羅里達州的三個時間點進行評估。結果顯示，64%的回應被認為是「可接受的」，但根據版本和地點有所不同。佛羅里達州的回應更可能被評為「不準確且可能有害」。整體來看，雖然大部分回應可接受，但準確性和可讀性仍需提升，以增強對斜視家長和病患的實用性。 PubMed DOI

The performance of ChatGPT-4 and Bing Chat in frequently asked questions about glaucoma.
ChatGPT-4 和 Bing Chat 在青光眼常見問題中的表現。 Eur J Ophthalmol 2025-02-20

這項研究評估了ChatGPT-4和Bing Chat對34個青光眼常見問題的回應，重點在適當性、準確性和可讀性。結果顯示，ChatGPT-4的適當回應比例為88.2%，高於Bing Chat的79.2%。兩者在準確性上差異不大，ChatGPT-4略高（3.86），Bing Chat為3.70。可讀性方面，兩者的回應對一般美國成年人來說都較難理解，ChatGPT-4的字數平均為316.5，明顯高於Bing Chat的61.6字。總體而言，雖然兩者都提供適當回應，但ChatGPT-4的回應較複雜且可讀性較低。 PubMed DOI

Evaluating the role of AI chatbots in patient education for abdominal aortic aneurysms: a comparison of ChatGPT and conventional resources.
評估 AI 聊天機器人在腹主動脈瘤患者教育中的角色：ChatGPT 與傳統資源的比較。 ANZ J Surg 2025-03-05

這項研究評估了ChatGPT提供的腹主動脈瘤（AAA）資訊質量，並與澳洲健康指導（HDA）進行比較。研究發現，ChatGPT的回應臨床上適當，但可讀性較高，達到大學水平，而HDA則在10到12年級。雖然ChatGPT的回應通常更易理解，但可行性得分較低，且行動建議不夠明確。總體來看，ChatGPT可作為病人教育的工具，但需改進以提升其幫助病人做出知情決策的能力。 PubMed DOI

Comparison of ChatGPT-4, Microsoft Copilot, and Google Gemini for Pediatric Ophthalmology Questions.
ChatGPT-4、Microsoft Copilot 與 Google Gemini 在小兒眼科問題上的比較 J Pediatr Ophthalmol Strabismus 2025-05-27

研究比較了ChatGPT、Google Gemini和Microsoft Copilot在小兒眼科選擇題的表現，Copilot正確率最高（74%），也最容易閱讀。雖然這些AI對學習有幫助，但答案不一定完全正確，使用時還是要多加留意。 PubMed DOI

Evaluating the effectiveness of chatbots and traditional resources in patient education on dry eye disease.
評估聊天機器人與傳統資源於乾眼症患者衛教之成效 Clin Exp Optom 2025-06-26

AI聊天機器人（如ChatGPT-3.5、Gemini、Llama）提供的乾眼症資訊，正確度和易懂度跟美國眼科醫學會（AAO）官網差不多。Gemini說明最容易理解，AAO內容最容易閱讀。雖然AI回答語言較複雜，對部分病患來說可能較難懂，但整體資訊正確且安全。AI可作為病患衛教輔助，但不能取代醫師，未來應加強易讀性。 PubMed DOI

原始文章

站上相關主題文章列表