LLM 相關三個月內文章 / 第 27 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這項研究開發了一套自動化系統,運用大型語言模型和自然語言處理,從文獻中擷取健康社會決定因素,並結合阿茲海默症的生物資料建立知識圖譜。透過圖神經網路預測關聯,有助於了解社會因素對AD風險的影響,且方法也適用於其他健康議題。程式碼已公開在GitHub。 相關文章 PubMed 推理

這篇研究發現,就算只有少量高品質標註,只要用像 GPT-4o 這種高品質合成標註來微調 Llama 3.1-8B 這類輕量級語言模型,醫療任務表現也能大幅提升(micro F1 可達 0.91)。即使合成標註品質較差,微調後的模型表現還是能超越原本的雜訊標註,顯示模型很有韌性,合成資料在醫療 LLM 微調上很有潛力。 相關文章 PubMed 推理

這項研究分析超過9萬則推特,並精細標註1,000則推文,提升辨識藥物與膳食補充劑關係的能力。結合BioBERT和ChatGPT,關係偵測準確率很高(F1值最高0.99),但實體辨識較難,因為類型太像。這方法有助於監測補充劑使用和藥物交互作用,也證明傳統NLP和大型語言模型結合在醫療文本分析上很有潛力。 相關文章 PubMed 推理

**重點整理:** 大型語言模型可以準確分類安全事件通報(例如:職場暴力、溝通失誤),協助醫療機構快速掌握安全趨勢,並透過自動化分析來提升職場安全。 相關文章 PubMed 推理

這項研究發現,結合 soft prompt-based learning 和大型語言模型(像 GatorTronGPT),能大幅提升從不同醫院和疾病的臨床文本中萃取社會健康決定因素(SDoH)的效果。經過 prompt-tuning 的 GatorTronGPT,F1 分數最高比傳統 fine-tuned 模型多出 21.8%,顯示它在跨領域應用上表現更好。 相關文章 PubMed 推理

作者開發了一套系統,能自動從病例報告中擷取並標註臨床事件的時間點,轉成時間序列資料。比較人工和大型語言模型(LLM)標註結果,發現LLM在事件回溯表現普通,但在時間標註上很準確。這研究提供了分析臨床時間序列的新工具和基準,程式碼已開源於GitHub。 相關文章 PubMed 推理

這項研究測試了一款專為美國非裔族群設計的口腔癌AI聊天機器人,專家普遍認為它資訊正確、好用(正面回饋超過83%),但建議加強開場說明、介面簡單化、無障礙設計及專業術語解釋。整體來說,這個聊天機器人有助提升健康知識,減少健康不平等。 相關文章 PubMed 推理

這項研究比較多種大型語言模型,發現經過微調的GatorTronGPT在從臨床紀錄中擷取鴉片類藥物過量和使用障礙的關鍵資訊上表現最佳。結果顯示,生成式LLM能有效協助擷取相關資訊,對後續研究和介入措施很有幫助。 相關文章 PubMed 推理

這項研究發現,結合RAG技術的AI模型能產生比一般AI更優質、可讀性更高且重複性較低的下背痛衛教資料,但內容仍未達臨床標準。AI在提升衛教品質上有潛力,但還需進一步改進,才能真正應用於臨床。 相關文章 PubMed 推理

EntroLLM 是結合 entropy 和大型語言模型嵌入的新方法,用來提升穿戴式裝置資料預測健康風險的準確度。在 NHANES 資料集預測過重時,AUC 從 0.56 提升到 0.64,表現比傳統模型更好,顯示分析複雜健康資料很有潛力。 相關文章 PubMed 推理