這項研究評估了ChatGPT-3.5在回答青光眼相關常見問題的有效性。由十二位專家組成的評估小組針對四個主題的40個問題進行評分,結果顯示AI的回答整體得分為正面,平均約為4分(「同意」)。不過,全面性得分最低(3.7),顯示回答常缺乏深度。具體來說,20%的問題在連貫性上得分低於4,42.5%在事實性上得分低於4,60%在全面性上得分低於4,20%在安全性上得分低於4。專家指出AI缺乏個別病人情況的考量。因此,雖然AI的回答普遍可接受,但不應依賴其進行青光眼的個人化諮詢。
PubMed
DOI
♡