LLM 相關三個月內文章 / 第 78 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

最新研究比較人類考生和三款AI(OpenAI o1、ChatGPT-4o、Gemini 1.5 Flash)在500題眼科專科考試的表現,結果OpenAI o1正確率最高(84.6%),在各領域和難度都勝過其他AI和人類。這顯示AI在眼科教育和醫療輔助上有很大發展潛力。 相關文章 PubMed DOI 推理

SpikeNet2 是一套用來自動偵測腦電圖癲癇放電的深度學習模型,準確度媲美專家。它用大量多中心資料訓練,採用殘差網路和 hard-negative mining 技術,有效降低誤判。不論單一波形或整份腦電圖判讀都很穩定,適合臨床和遠距醫療,對資源有限的醫療環境特別有幫助。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-3.5在眼科診斷上,只有約一半能正確列出首選診斷,三成案例甚至完全沒答對。補充病人資訊只對神經眼科有幫助。整體來說,ChatGPT-3.5可當輔助工具,但準確度還不夠,無法取代醫師判斷。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT 3.5 和 Google Bard 在回答醫學生眼科簡答題時,大多能給出正確答案,ChatGPT 3.5 表現稍好,尤其在操作步驟題。不過,兩者約有 17–19% 答案有明顯錯誤或遺漏重點。建議用來輔助複習,但還是要搭配教科書,不能完全依賴。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT 3.5在回答心臟衰竭和動脈導管未閉相關問題時,表現都不錯。雖然針對心臟衰竭的答案比較正確且完整,但動脈導管未閉的回答較容易懂。兩者表現沒有明顯差異。不過,ChatGPT在醫療資訊品質上還有進步空間。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT-3.5 和 4.0 在診斷神經眼科病例的準確率和答案品質都比 Bard 和 Bing 好,不過 Bard 回覆速度最快。整體來說,ChatGPT 這類大型語言模型未來有機會幫助眼科醫師做臨床決策。 相關文章 PubMed DOI 推理

這項研究比較五種大型語言模型和兩組人類專家在眼底疾病測驗的表現。ChatGPT-4表現最好,分數和信心都最高,跟一般眼科醫師差不多,但還不如專科醫師。結果顯示,ChatGPT-4在眼科領域很有潛力,未來LLMs若再進步,對醫療照護會更有幫助。 相關文章 PubMed DOI 推理

這篇研究回顧2014到2024年NLP在癌症登記的應用,發現規則式、機器學習和深度學習方法都很常見,近年transformer模型(如BERT)越來越熱門。不過,小兒癌症、黑色素瘤等類型和疾病進展、臨床試驗配對等主題研究較少。研究建議未來應加強這些領域,才能發揮NLP技術的最大效益。 相關文章 PubMed DOI 推理

2025年英國調查顯示,多數家庭醫師看好生成式AI能提升臨床紀錄和行政效率,但實際受過AI訓練的人很少,雇主也不太鼓勵使用。醫師普遍認為AI難以提升同理心,對公平性也有疑慮,認為未來若要導入AI,還需要更多訓練和明確指引。 相關文章 PubMed DOI 推理

這篇文章介紹數位精神醫學,強調結合AI和數位技術自動化診斷與治療流程,不只是做聊天機器人。作者提出用大型AI模型、數位人類和VR等技術,打造全自動化的數位精神科診所。內容也討論最新技術、臨床應用、系統建置步驟、實際挑戰,以及病人、醫療人員和法規相關議題。 相關文章 PubMed DOI 推理