LLM 相關三個月內文章 / 第 153 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

TL;DR: ChatABL 結合大型語言模型和溯因學習,讓感知、語言理解和推理三種能力能互相配合。它用 LLMs 來整理知識、提升感知,感知模組再回饋給 LLMs,形成自動學習的循環。實驗證明,ChatABL 在手寫方程式辨識上表現比多數方法好,顯示這種自然語言互動有機會讓 AI 更像人類思考。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT(特別是GPT-4o)在唇顎裂問題的回答上,表現中等,內容清楚易懂,有時甚至比資淺醫師還專業。不過,AI還是缺乏臨床經驗和細緻判斷,無法完全取代資深醫師。AI適合當輔助工具,幫助病患教育和溝通,搭配專家一起用,能提升照護品質。 相關文章 PubMed DOI 推理

在肯亞鄉村的研究中,多模態AI模型POE診斷準確率達79.4%,和耳鼻喉科醫師建議一致性高達96.8%,明顯優於基層醫療人員(僅50.8%)。POE還能補足PCPs漏診的病例(61.3%),善用臨床影像,顯示在醫師不足的地區很有潛力當臨床決策輔助工具。 相關文章 PubMed DOI 推理

這項初步研究發現,AI生成的學術摘要即使經過人工編輯或模仿特定作者風格,還是有很大機率被AI偵測工具抓出來。雖然人工編輯能降低被發現的機率,但不代表就能完全避開偵測。不同偵測工具結果也不太一樣,未來還需要更多研究來釐清AI寫作和偵測之間的互動。 相關文章 PubMed DOI 推理

這項研究發現,住院醫師寫的出院摘要在品質、正確性和完整性上都優於ChatGPT,但兩者的可讀性差不多。針對長期住院(超過三個月)的病人,ChatGPT的表現和醫師差不多。未來只要做好隱私保護,ChatGPT有機會協助產生出院摘要,特別適合複雜或長期住院的個案。 相關文章 PubMed DOI 推理

這項研究開發了一個輕量級雙重注意力神經網路,能有效分析12導程心電圖來預測心衰竭風險。模型結合跨導程與導程專屬注意力模組,並用大型語言模型預訓練,降低過擬合。經UK Biobank資料微調後,預測準確率和可解釋性都優於現有方法。 相關文章 PubMed DOI 推理

這項研究比較Isabel Pro和ChatGPT-4在診斷201個NEJM病例的表現,發現用Tree-of-Thought提示法雖然能提升ChatGPT-4的回憶率,但正確診斷數量和排名還是輸給Isabel Pro。專家小組人數多反而沒比較好,兩人小組表現最佳。ChatGPT-4診斷結果重現性不高,引用文獻也常出錯。整體來說,ChatGPT-4目前還不適合臨床使用。 相關文章 PubMed DOI 推理

研究團隊開發了一套五大面向的評估框架,專門用來檢視生成式AI在醫療領域的表現。實測結果顯示,ClinicalKey AI的正確率和有用性都超過九成,潛在有害回答極低。這個框架能有效全面評估AI,但主觀判斷和危害共識仍有待加強,未來可作為AI臨床應用的重要參考。 相關文章 PubMed DOI 推理

生成式AI快速改變醫學寫作,期刊如JKMS明訂AI不能列為作者,但允許在文中揭露AI協助內容,並需詳述工具、指令及用途。AI偵測工具目前不可靠,重點在於強化倫理與透明揭露,才能兼顧出版誠信與創新發展。 相關文章 PubMed DOI 推理

這項研究測試用 ChatGPT 協助護理教育領域做系統性文獻回顧時,篩選摘要的可行性。作者用四種 ChatGPT 版本篩選 400 篇摘要,並和人類研究者比較。結果發現,ChatGPT-3.5 Turbo 篩選速度最快且漏掉的相關文獻最少,反而新版 ChatGPT-4 漏掉更多。大型語言模型能幫助護理人員省時又不影響品質,但還是要主動學習和實際操作,才能發揮最大效益。 相關文章 PubMed DOI 推理