原始文章

這項研究評估了ChatGPT-4和Bing Chat對34個青光眼常見問題的回應,重點在適當性、準確性和可讀性。結果顯示,ChatGPT-4的適當回應比例為88.2%,高於Bing Chat的79.2%。兩者在準確性上差異不大,ChatGPT-4略高(3.86),Bing Chat為3.70。可讀性方面,兩者的回應對一般美國成年人來說都較難理解,ChatGPT-4的字數平均為316.5,明顯高於Bing Chat的61.6字。總體而言,雖然兩者都提供適當回應,但ChatGPT-4的回應較複雜且可讀性較低。 PubMed DOI


站上相關主題文章列表

比較 Bing Chat 與 ChatGPT-3.5 在眼科考試中的表現,結果發現 Bing Chat 表現較好,特別是在一般醫學問題上更優秀。Bing Chat 使用了多種線上資源,呈現更易讀。評審認為其準確度較高,主要參考 eyewiki.aao.org、aao.org、wikipedia.org 和 ncbi.nlm.nih.gov。Bing Chat 的改進功能對眼科學習者有幫助,但使用者仍需保持懷疑態度並評估所引用的來源。 PubMed DOI

研究發現ChatGPT對青光眼相關知識表現準確。比較眼科網站、社群媒體及歐洲青光眼學會指南,發現ChatGPT在一般知識、診斷、治療及預防方面表現優異。尤其根據歐洲青光眼學會指南,ChatGPT回答大部分問題都正確。 PubMed DOI

研究發現AI聊天機器人(ChatGPT-4、Bard和Bing)提供的青光眼資訊與美國眼科學會(AAO)的資料有差異。ChatGPT回答最全面,但AAO更準確。AI聊天機器人仍需改進才能成為可靠資訊來源,醫護人員在討論青光眼時應留意這些限制。 PubMed DOI

研究發現ChatGPT在與青光眼患者溝通時,回應較複雜且少用眼科術語,可能讓患者難以理解。建議醫護人員應確保溝通清晰易懂,使用更簡單的用語,例如「看眼科醫師」。 PubMed DOI

這項研究評估了三款AI聊天機器人—ChatGPT、Bard和Bing—在回答青光眼相關問題的準確性。共提出32個問題,結果顯示:ChatGPT正確率56.3%、Bard為78.1%、Bing則是59.4%。雖然準確性有差異,但統計分析顯示三者之間並無顯著差異(p = 0.195)。研究指出,這些AI聊天機器人能提供有用的青光眼資訊,但使用者仍需謹慎,因為準確性可能不一。 PubMed DOI

這項研究評估了大型語言模型(LLM)ChatGPT 在青光眼領域的表現。研究人員提出了24個臨床問題,並由三位專家評分。結果顯示,ChatGPT的平均得分為3.29,整體表現良好,但有29.2%的回應得分低於3分。經過自我修正後,得分從2.96提升至3.58,滿分回應比例也從30.6%增至57.1%。這顯示ChatGPT在青光眼領域有潛力,但仍需更多研究來驗證其應用。 PubMed DOI

這項研究評估了ChatGPT-3.5在回答青光眼相關常見問題的有效性。由十二位專家組成的評估小組針對四個主題的40個問題進行評分,結果顯示AI的回答整體得分為正面,平均約為4分(「同意」)。不過,全面性得分最低(3.7),顯示回答常缺乏深度。具體來說,20%的問題在連貫性上得分低於4,42.5%在事實性上得分低於4,60%在全面性上得分低於4,20%在安全性上得分低於4。專家指出AI缺乏個別病人情況的考量。因此,雖然AI的回答普遍可接受,但不應依賴其進行青光眼的個人化諮詢。 PubMed DOI

這項研究評估了兩個AI聊天機器人,ChatGPT-3.5和Google Bard,提供的青光眼手術資訊的質量與可讀性。研究發現,ChatGPT-3.5的適當回答率高達96%,而Google Bard則為68%。不過,在可讀性方面,Google Bard的回答更易於理解,Flesch可讀性評分顯示其得分為57.6,遠高於ChatGPT-3.5的22.6。這顯示出準確性與可讀性之間的權衡,強調了清晰且準確的醫療資訊對患者的重要性,並呼籲進一步研究AI工具在醫療領域的有效性。 PubMed DOI

這項研究探討了Google和ChatGPT在提供青光眼常見問題解答的準確性與易讀性。結果顯示,ChatGPT的準確性高達97%,遠超過Google的77%。不過,ChatGPT的初始閱讀水平較高(14.3級),而Google為9.4級。當要求ChatGPT修訂青光眼教育材料時,它成功將閱讀水平降至9.4級,且準確性未受影響。這顯示ChatGPT能提供更清晰易懂的資訊,增進病人教育,改善理解與治療遵從性,顯示其在青光眼資訊及教育資源開發上的潛力。 PubMed DOI

這項研究評估了大型語言模型ChatGPT-4o對圓錐角膜相關問題的回答準確性與可讀性。研究中,兩位眼科醫生對ChatGPT-4o的30個回答進行評分,結果顯示平均準確性為4.48分,評分一致性良好。然而,回答的可讀性較高,SMOG分數為15.49,FKGL為14.95,FRE為27.41,顯示一般民眾理解上有困難。雖然ChatGPT-4o的回答準確,但語言複雜性可能影響理解,建議未來改進以提升可及性。 PubMed DOI