原始文章

ChatGPT-4 回答 AMD 病患常見問題時,內容大致正確、連貫且安全,專家多給予正面評價。但還是有資訊過時或不夠完整的情況,所以目前不建議用來做 AMD 病患的日常或個人化衛教諮詢。 PubMed DOI


站上相關主題文章列表

研究評估了ChatGPT-4對「弱視」和「兒童近視」問題的回答,兩位兒科眼醫發現96.4%的回答一致。ChatGPT對84.6%問題有可接受回答,但也有不完整或不適當的。總結來說,ChatGPT在兒科眼科領域有成為患者和照護者資訊工具的潛力。 PubMed DOI

研究發現人工智慧模型對糖尿病視網膜病變問題的回答表現不錯,但仍有改進空間。專家們認為人工智慧在回答問題時相當準確,且內容適當完整。 PubMed DOI

這項研究評估了大型語言模型(LLM)ChatGPT 在青光眼領域的表現。研究人員提出了24個臨床問題,並由三位專家評分。結果顯示,ChatGPT的平均得分為3.29,整體表現良好,但有29.2%的回應得分低於3分。經過自我修正後,得分從2.96提升至3.58,滿分回應比例也從30.6%增至57.1%。這顯示ChatGPT在青光眼領域有潛力,但仍需更多研究來驗證其應用。 PubMed DOI

這篇論文探討了兩個大型語言模型(LLMs),ChatGPT4 和 PaLM2,對於年齡相關黃斑變性(AMD)患者常見問題的回答效果。研究強調患者了解病情對於慢性疾病管理的重要性。從專注於 AMD 的網站整理了143個問題,並讓這兩個模型及三位眼科醫生回答。結果顯示,ChatGPT4 在臨床共識、潛在危害等方面表現優於 PaLM2,顯示出這些模型在患者教育上的潛力,但仍需謹慎使用,不能取代專業醫療建議。 PubMed DOI

這項研究評估了ChatGPT(4.0版)在生成與常見視網膜疾病相關回應的表現,依據美國眼科醫學會的指導方針進行。研究包含130個問題,涵蓋12個領域,專家評估回應的相關性和準確性。結果顯示,ChatGPT的平均得分為4.9分,與指導方針高度一致,但外科管理得分最低。回應可讀性較低,需大學以上理解能力,且在診斷和治療選擇上有錯誤。整體而言,雖然顯示潛力,但仍需臨床醫師監督及改進。 PubMed DOI

這項研究評估了ChatGPT對眼科病人問題的回答準確性和重現性。研究人員從美國眼科學會的「詢問眼科醫生」頁面收集了150個問題,經過兩位眼科醫生的精煉,最終有117個問題輸入ChatGPT。結果顯示,ChatGPT對59.8%的問題提供了全面回答,且在91.5%的問題上保持一致性。雖然其準確性和重現性中等,但應視為健康資訊的輔助來源,而非專業醫療建議的替代品,未來仍需進一步研究以評估其可靠性。 PubMed DOI

這項研究評估了ChatGPT-3.5在回答青光眼相關常見問題的有效性。由十二位專家組成的評估小組針對四個主題的40個問題進行評分,結果顯示AI的回答整體得分為正面,平均約為4分(「同意」)。不過,全面性得分最低(3.7),顯示回答常缺乏深度。具體來說,20%的問題在連貫性上得分低於4,42.5%在事實性上得分低於4,60%在全面性上得分低於4,20%在安全性上得分低於4。專家指出AI缺乏個別病人情況的考量。因此,雖然AI的回答普遍可接受,但不應依賴其進行青光眼的個人化諮詢。 PubMed DOI

這項研究評估了ChatGPT-4在葡萄膜炎患者教育中的有效性,並與知名醫療網站進行比較。研究分析了八個可信來源的資訊,並由三位專家評估內容的偏好、全面性和準確性。結果顯示,專家偏好ChatGPT-4的標準回應,因為其內容全面且準確性與現有網站相似。簡化回應則更易於理解,適合不同教育水平的患者。總體而言,研究建議ChatGPT-4能有效提供準確的葡萄膜炎資訊,並可根據患者需求調整。 PubMed DOI

針對斜視和弱視的問題,ChatGPT-4的回應評估顯示,97%的回答是可接受的。這項研究由小兒眼科醫師獨立評估,並使用可讀性工具進行分析。雖然大部分回應都合格,但有3%的回應被認為不完整,且沒有發現不可接受的內容。不過,這些回應的可讀性較高,需具備大學程度的教育才能理解,顯示出ChatGPT-4在準確性上表現良好,但在可讀性上仍需改進,以便讓一般民眾和醫療專業人員更容易理解。 PubMed DOI

這項研究評估了ChatGPT-4和Bing Chat對34個青光眼常見問題的回應,重點在適當性、準確性和可讀性。結果顯示,ChatGPT-4的適當回應比例為88.2%,高於Bing Chat的79.2%。兩者在準確性上差異不大,ChatGPT-4略高(3.86),Bing Chat為3.70。可讀性方面,兩者的回應對一般美國成年人來說都較難理解,ChatGPT-4的字數平均為316.5,明顯高於Bing Chat的61.6字。總體而言,雖然兩者都提供適當回應,但ChatGPT-4的回應較複雜且可讀性較低。 PubMed DOI