原始文章

這項研究探討使用大型語言模型(LLMs)為眼科筆記創建簡明語言摘要(PLSs),旨在提升非眼科醫師的理解與溝通。研究結果顯示,85%的非眼科醫師偏好PLSs,且在診斷理解、筆記細節滿意度及解釋清晰度上均有顯著改善。PLSs也縮小了醫師間對眼科術語的理解差距。雖然PLSs的可讀性和意義保留良好,但審查中發現26%的錯誤率,需謹慎使用。總體而言,PLSs有助於增進非眼科醫師的理解與跨學科溝通。 PubMed DOI


站上相關主題文章列表

大型語言模型(LLMs)是自然語言處理的前沿技術,透過深度學習模擬人類語言理解與生成。隨著變壓器架構的引入,LLMs在類人互動上展現出色的能力,特別是在醫療領域,能增強醫療人員與患者的溝通。這篇回顧探討了LLMs的演變及其在臨床應用的潛力,包括自動化醫療文檔、分診建議及個性化教育材料的創建。文章也提到LLMs的限制及解決方案,強調其在眼科等領域提升醫療服務質量的潛力。 PubMed DOI

這篇論文探討了兩個大型語言模型(LLMs),ChatGPT4 和 PaLM2,對於年齡相關黃斑變性(AMD)患者常見問題的回答效果。研究強調患者了解病情對於慢性疾病管理的重要性。從專注於 AMD 的網站整理了143個問題,並讓這兩個模型及三位眼科醫生回答。結果顯示,ChatGPT4 在臨床共識、潛在危害等方面表現優於 PaLM2,顯示出這些模型在患者教育上的潛力,但仍需謹慎使用,不能取代專業醫療建議。 PubMed DOI

這項研究評估了土耳其眼科協會針對早產兒視網膜病變的病患教育材料可讀性,並與大型語言模型(如GPT-4.0、GPT-4o mini和Gemini)生成的內容進行比較。結果顯示,TOA的材料可讀性超過六年級,而GPT-4.0和Gemini則更易讀。經調整後,GPT-4.0的可讀性改善,且在準確性和全面性上得分最高,Gemini則最低。研究指出,GPT-4.0在創建可及的病患教育材料上有潛力,但使用LLMs時需考慮地區醫療差異和資訊準確性。 PubMed DOI

這項研究探討大型語言模型(LLMs)在總結睡眠醫學研究文章的效果,並與醫學生的摘要進行比較。19名醫學生評估了三個AI生成和三個人類生成的摘要,結果顯示兩者在可讀性和理解上無顯著差異(p值均大於0.2)。不過,研究也指出參與者人數少、可能的偏見及缺乏視覺輔助等限制。總體來看,AI生成的摘要與人類的相當,但仍需進一步研究以了解AI在醫學文獻總結中的優缺點。 PubMed DOI

這項研究評估了GPT-4在簡化醫學文獻的表現,目的是幫助病人更好理解青光眼護理。研究將62篇青光眼期刊摘要和9篇病人教育材料轉換為五年級的閱讀水平。結果顯示,摘要的可讀性顯著改善,FKGL平均下降3.21分,FKRE上升28.6分;病人教育材料的FKGL下降2.38分,FKRE上升12.14分。整體來看,GPT-4有效提升了青光眼相關資訊的可讀性,讓病人更容易理解。 PubMed DOI

這項研究評估了五個大型語言模型(LLMs)在回答眼表疾病相關問題的表現,包括ChatGPT-4、ChatGPT-3.5、Claude 2、PaLM2和SenseNova。研究團隊設計了100道單選題,涵蓋角膜炎等主題。結果顯示,ChatGPT-4的準確性和可信度最佳,成功率為59%,但仍有28%的錯誤率。PaLM2在答案準確性上表現良好,相關係數達0.8。整體而言,這些模型在醫學教育和臨床實踐中展現了潛力,特別是ChatGPT-4的表現尤為突出。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在處理眼科緊急情況的表現,並與英國國民健康服務(NHS)111的系統進行比較。研究涵蓋21個緊急情境問題,測試的模型包括ChatGPT-3.5、Google Bard、Bing Chat和ChatGPT-4.0。結果顯示,93%的LLM回應至少得分為「良好」,顯示它們提供的資訊正確且無重大錯誤。整體來看,這些模型在提供即時資訊和指導方面,顯示出作為有效工具的潛力,能提升患者護理及醫療可及性。 PubMed DOI

近年來,人工智慧(AI)技術,特別是大型語言模型(LLMs)的進步,對傳統醫療實踐有著顯著影響,能提升醫療效率與品質。在眼科領域,LLMs 可協助醫生診斷眼疾、優化治療建議、簡化醫療紀錄撰寫,並提供教育支持。然而,LLMs 在臨床應用中仍面臨挑戰,如知識基礎限制、AI 幻覺現象,以及數據隱私問題。未來的研究將對克服這些挑戰並發揮 LLMs 的潛力至關重要。 PubMed DOI

這項研究回顧了大型語言模型(LLMs)在眼科的應用,特別是高排名期刊的相關文章,共分析了101篇研究,主要來自美國、英國和加拿大。研究指出,LLMs在醫學教育、臨床協助、研究及病人教育中有顯著貢獻,但也引發了對表現不一致、偏見及倫理問題的擔憂。作者強調持續改進AI的重要性,並呼籲建立倫理指導方針及跨學科合作,以應對這些挑戰,展現LLMs在眼科的潛力與限制。 PubMed DOI

這項研究比較了 ChatGPT 3.5 和 Google Gemini 1.0 Pro 在生成視網膜門診紀錄的表現。結果顯示,ChatGPT 3.5 不論在轉錄準確度還是紀錄品質都優於 Gemini。不過,兩者偶爾還是會出現資訊錯誤。整體來說,這類 AI 有助減輕醫師紀錄負擔,但還需要再優化才能更安心使用。 PubMed DOI