原始文章

本研究評估了ChatGPT在分析青光眼患者案例及建議手術治療的能力。對60例手術案例進行回顧性分析,結果顯示ChatGPT的建議準確率為78%,在普通案例中表現良好,與專家建議相近。然而,在挑戰性案例中準確率下降至65%,顯示其在複雜情境下的局限性。總體而言,ChatGPT在普通案例中能提供合理的治療計畫,但在處理更具挑戰性的情況時仍需謹慎。 PubMed DOI


站上相關主題文章列表

研究比較ChatGPT生成的青光眼手術健康資訊與現有線上資料,發現兩者閱讀難度都高(11至12年級),且資訊品質一般。ChatGPT在評估資源品質方面表現準確,但對一般讀者來說仍複雜。儘管未達預期閱讀水準,ChatGPT可協助自動化評估。 PubMed DOI

最新研究發現,人工智慧如ChatGPT-4在屈光手術領域有潛力,可幫助分類患者。研究顯示ChatGPT-4與醫師的判斷相當一致,但仍有限制,如樣本量小、依賴單一評定者及輸出變異性。未來需進一步研究,確保大型語言模型如ChatGPT-4在醫療決策中的準確性與適用性。 PubMed DOI

研究比較了ChatGPT-4和Google Gemini在分析青光眼病例描述及提出手術計劃的表現。ChatGPT-4在與專家一致性和回應品質方面表現較佳,尤其在複雜病例中。兩者常建議小梁切除術。總體而言,ChatGPT-4在分析青光眼手術病例方面表現良好,Google Gemini則在回答問題上有限制。 PubMed DOI

研究發現ChatGPT對青光眼相關知識表現準確。比較眼科網站、社群媒體及歐洲青光眼學會指南,發現ChatGPT在一般知識、診斷、治療及預防方面表現優異。尤其根據歐洲青光眼學會指南,ChatGPT回答大部分問題都正確。 PubMed DOI

這項研究評估了大型語言模型(LLM)ChatGPT 在青光眼領域的表現。研究人員提出了24個臨床問題,並由三位專家評分。結果顯示,ChatGPT的平均得分為3.29,整體表現良好,但有29.2%的回應得分低於3分。經過自我修正後,得分從2.96提升至3.58,滿分回應比例也從30.6%增至57.1%。這顯示ChatGPT在青光眼領域有潛力,但仍需更多研究來驗證其應用。 PubMed DOI

這項研究評估了ChatGPT對眼科病人問題的回答準確性和重現性。研究人員從美國眼科學會的「詢問眼科醫生」頁面收集了150個問題,經過兩位眼科醫生的精煉,最終有117個問題輸入ChatGPT。結果顯示,ChatGPT對59.8%的問題提供了全面回答,且在91.5%的問題上保持一致性。雖然其準確性和重現性中等,但應視為健康資訊的輔助來源,而非專業醫療建議的替代品,未來仍需進一步研究以評估其可靠性。 PubMed DOI

這項研究評估了ChatGPT在眼科臨床評估中的表現,目的是檢視其準確性及眼科醫生是否能辨識其生成的回應。研究中,16位眼科醫生參與,ChatGPT在17個案例中準確識別了15個主要診斷(88.2%)。醫生們在13個案例中以77.9%的準確率辨識出回應作者,信心評分為3.6。醫生指出ChatGPT的回應較為一般,常有不相關資訊及句法模式。結論認為,雖然ChatGPT顯示潛力,但在臨床應用前仍需進一步評估。 PubMed DOI

這項研究評估了ChatGPT-3.5在回答青光眼相關常見問題的有效性。由十二位專家組成的評估小組針對四個主題的40個問題進行評分,結果顯示AI的回答整體得分為正面,平均約為4分(「同意」)。不過,全面性得分最低(3.7),顯示回答常缺乏深度。具體來說,20%的問題在連貫性上得分低於4,42.5%在事實性上得分低於4,60%在全面性上得分低於4,20%在安全性上得分低於4。專家指出AI缺乏個別病人情況的考量。因此,雖然AI的回答普遍可接受,但不應依賴其進行青光眼的個人化諮詢。 PubMed DOI

這項研究評估了兩個AI聊天機器人,ChatGPT-3.5和Google Bard,提供的青光眼手術資訊的質量與可讀性。研究發現,ChatGPT-3.5的適當回答率高達96%,而Google Bard則為68%。不過,在可讀性方面,Google Bard的回答更易於理解,Flesch可讀性評分顯示其得分為57.6,遠高於ChatGPT-3.5的22.6。這顯示出準確性與可讀性之間的權衡,強調了清晰且準確的醫療資訊對患者的重要性,並呼籲進一步研究AI工具在醫療領域的有效性。 PubMed DOI

這項研究評估了ChatGPT在分析葡萄膜黑色素瘤患者案例並提供治療建議的能力。研究回顧了40名患者的案例,發現ChatGPT的手術建議準確性為55%,排除眼球摘除後提高至75%。與三位專家的建議一致性分別為50%、55%和57%,在排除眼球摘除後則提升至70%至75%。雖然ChatGPT在簡單案例中表現不錯,但在處理更複雜的情況時仍有其限制,顯示出需要更全面的患者評估。 PubMed DOI