LLM 相關三個月內文章 / 第 3 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

研究團隊開發了一套結合AI副駕的大型語言模型化學機器人平台,能把自然語言指令轉成自動化實驗操作。這系統可即時設計實驗、查文獻並對話互動,靈活合成化合物。已成功合成13種無機材料,還發現新型Mn-W多金屬氧酸鹽,展現AI加速材料發現的潛力。 相關文章 PubMed DOI 推理

這篇系統性回顧整理了2021到2024年間LLMs在臨床護理的最新研究,分析15篇文獻。結果顯示LLMs能提升護理效率與品質,協助決策、衛教、紀錄及流程,但也有資料隱私、誤導內容和倫理等挑戰。文中也討論解方,預期未來LLMs會更廣泛應用於護理實務。 相關文章 PubMed DOI 推理

這項研究發現,GPT-4和GPT-3.5-turbo在總結急診紀錄時,雖然GPT-4表現較好,但兩者都常出現內容錯誤或遺漏重要細節,尤其在計畫、身體檢查和病史部分。完全正確的摘要比例偏低,且少數錯誤可能有嚴重後果。了解錯誤類型和位置,對臨床應用AI生成醫療紀錄及醫師審查很重要。 相關文章 PubMed DOI 推理

TL;DR: ChatABL 結合大型語言模型和溯因學習,讓感知、語言理解和推理三種能力能互相配合。它用 LLMs 來整理知識、提升感知,感知模組再回饋給 LLMs,形成自動學習的循環。實驗證明,ChatABL 在手寫方程式辨識上表現比多數方法好,顯示這種自然語言互動有機會讓 AI 更像人類思考。 相關文章 PubMed DOI 推理

這項研究發現,ChatGPT(特別是GPT-4o)在唇顎裂問題的回答上,表現中等,內容清楚易懂,有時甚至比資淺醫師還專業。不過,AI還是缺乏臨床經驗和細緻判斷,無法完全取代資深醫師。AI適合當輔助工具,幫助病患教育和溝通,搭配專家一起用,能提升照護品質。 相關文章 PubMed DOI 推理

在肯亞鄉村的研究中,多模態AI模型POE診斷準確率達79.4%,和耳鼻喉科醫師建議一致性高達96.8%,明顯優於基層醫療人員(僅50.8%)。POE還能補足PCPs漏診的病例(61.3%),善用臨床影像,顯示在醫師不足的地區很有潛力當臨床決策輔助工具。 相關文章 PubMed DOI 推理

這項初步研究發現,AI生成的學術摘要即使經過人工編輯或模仿特定作者風格,還是有很大機率被AI偵測工具抓出來。雖然人工編輯能降低被發現的機率,但不代表就能完全避開偵測。不同偵測工具結果也不太一樣,未來還需要更多研究來釐清AI寫作和偵測之間的互動。 相關文章 PubMed DOI 推理

這項研究發現,住院醫師寫的出院摘要在品質、正確性和完整性上都優於ChatGPT,但兩者的可讀性差不多。針對長期住院(超過三個月)的病人,ChatGPT的表現和醫師差不多。未來只要做好隱私保護,ChatGPT有機會協助產生出院摘要,特別適合複雜或長期住院的個案。 相關文章 PubMed DOI 推理

這項研究開發了一個輕量級雙重注意力神經網路,能有效分析12導程心電圖來預測心衰竭風險。模型結合跨導程與導程專屬注意力模組,並用大型語言模型預訓練,降低過擬合。經UK Biobank資料微調後,預測準確率和可解釋性都優於現有方法。 相關文章 PubMed DOI 推理

這項研究比較Isabel Pro和ChatGPT-4在診斷201個NEJM病例的表現,發現用Tree-of-Thought提示法雖然能提升ChatGPT-4的回憶率,但正確診斷數量和排名還是輸給Isabel Pro。專家小組人數多反而沒比較好,兩人小組表現最佳。ChatGPT-4診斷結果重現性不高,引用文獻也常出錯。整體來說,ChatGPT-4目前還不適合臨床使用。 相關文章 PubMed DOI 推理