LLM 相關三個月內文章 / 第 42 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究發現,GPT-4在選擇MRI掃描流程時,表現跟資淺放射科住院醫師差不多,尤其在心臟和神經影像領域表現較佳,但在肌肉骨骼案例較弱。結果顯示,GPT-4有機會協助新手醫師提升效率、減少錯誤,特別適合在工作繁忙時當作輔助工具。 相關文章 PubMed DOI 推理

生成式AI和大型語言模型,透過有效的提示工程,能幫助物理治療教育提升課程設計、案例創建及回饋效率。像IDEA方法這類技巧,讓教師更容易運用AI,推動創新,也協助師生適應AI結合的教學與醫療環境。圖表也整理了實用工具,方便教師快速上手。 相關文章 PubMed DOI 推理

這項研究推出 GynMedEval 資料集,收錄 515 個真實婦科病例,專門用來評估大型語言模型(LLMs)在婦科診斷的表現。結果顯示,LLMs 對常見疾病診斷還不錯,但準確率都沒超過 90%。GynMedEval 有助於提升 LLMs 在醫療診斷上的安全性和實用性。 相關文章 PubMed DOI 推理

這項研究建立了一套標準來評估大型語言模型在11種生醫知識擷取任務的表現。結果發現,模型表現會因任務難度、專業詞彙和資訊呈現方式而有明顯差異。雖然要求模型引用原始文獻有幫助,但要讓模型每次都穩定做到還是很有挑戰。 相關文章 PubMed DOI 推理

這項研究發現,單獨用大型語言模型診斷精神科案例時,常常會過度診斷。不過,若搭配專家設計的決策樹,診斷的準確度和整體表現都明顯提升,過度診斷也減少,敏感度幾乎沒變。這表示結合專家推理工具能讓AI在精神科診斷上更可靠。 相關文章 PubMed DOI 推理

這項研究把精選的腫瘤醫學知識庫(MOAlmanac)結合到RAG-LLM後,癌症治療建議的準確率最高可達95%,明顯優於只用LLM的方法。特別是在有結構化資料時,RAG-LLM在臨床決策支援上展現很高的實用性與可靠性。 相關文章 PubMed DOI 推理

這項研究發現,美國醫師用聊天機器人輔助臨床推理時,常見的輸入方式有四種:整個病例貼上、只貼重點、自己整理後輸入,或像搜尋引擎一樣簡短查詢。大多數醫師偏好直接貼上或簡短查詢。各種輸入方式在推理表現上沒有明顯差異。研究建議,未來應加強醫師相關AI工具的訓練,以提升醫療決策的效率與安全性。 相關文章 PubMed DOI 推理

作者開發了一套結合正則表達式和本地大型語言模型的 NLP 工作流程,能快速又準確地從非結構化電子病歷中擷取結構化臨床資料。這個模組化 Python 流程不僅保護隱私,還能處理大量報告,準確率高達 95%,大幅提升 EHR 資料在研究和決策支援上的應用效率。 相關文章 PubMed DOI 推理

這項研究發現,經過微調的大型語言模型(LLMs)能根據每日健康自評和相關文字描述,準確預測未來健康狀態,表現有時甚至比傳統數值模型更好,還能解釋預測原因。顯示LLMs在處理有文字資料的健康預測上很有潛力。 相關文章 PubMed DOI 推理

這篇回顧性研究發現,GPT-4和GPT-4 Omni在有臨床背景資訊時,對惡性大腦中動脈中風減壓手術病人的住院存活率預測表現中等(AUC最高0.70),但對長期或功能性預後的預測不太準確。只有在提供中風前mRS分數時,GPT-4 Omni才能預測出院時的mRS。整體來說,AI對短期預後有潛力,但對複雜結果仍有限制。 相關文章 PubMed DOI 推理