LLM 相關三個月內文章 / 第 15 頁
可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

這篇研究發現,大型語言模型在沒經過特別訓練下,結合檢索增強生成(RAG)和提示工程,能有效自動摘要專業資訊,表現不錯。不過,還是會遇到像網頁爬蟲限制和偶爾誤解任務等問題,未來還需要進一步優化。 相關文章 PubMed 推理

這項研究提出一套結合Google Gemini和特徵導向提示的可解釋AI架構,能自動從高精度眼動追蹤數據中偵測兒童弱視。方法透明、可信度高,分類準確,特別適合資源有限地區用於弱視篩檢,有助於臨床決策支援工具的發展。 相關文章 PubMed 推理

**重點摘要:** 這項研究顯示,GPT-4 可以準確自動化新耳鼻喉科轉診的預先病歷整理,在測試中與醫師的意見有 95% 的一致率。這個工具在實際診間中也獲得不錯的回饋,不過使用者覺得它節省的時間比預期的還要少。這次採用的設計策略,未來也可以作為自動化病歷摘要工具的參考。 相關文章 PubMed 推理

這項研究開發了一套自動化系統,運用大型語言模型和自然語言處理,從文獻中擷取健康社會決定因素,並結合阿茲海默症的生物資料建立知識圖譜。透過圖神經網路預測關聯,有助於了解社會因素對AD風險的影響,且方法也適用於其他健康議題。程式碼已公開在GitHub。 相關文章 PubMed 推理

這篇研究發現,就算只有少量高品質標註,只要用像 GPT-4o 這種高品質合成標註來微調 Llama 3.1-8B 這類輕量級語言模型,醫療任務表現也能大幅提升(micro F1 可達 0.91)。即使合成標註品質較差,微調後的模型表現還是能超越原本的雜訊標註,顯示模型很有韌性,合成資料在醫療 LLM 微調上很有潛力。 相關文章 PubMed 推理

這項研究分析超過9萬則推特,並精細標註1,000則推文,提升辨識藥物與膳食補充劑關係的能力。結合BioBERT和ChatGPT,關係偵測準確率很高(F1值最高0.99),但實體辨識較難,因為類型太像。這方法有助於監測補充劑使用和藥物交互作用,也證明傳統NLP和大型語言模型結合在醫療文本分析上很有潛力。 相關文章 PubMed 推理

**重點整理:** 大型語言模型可以準確分類安全事件通報(例如:職場暴力、溝通失誤),協助醫療機構快速掌握安全趨勢,並透過自動化分析來提升職場安全。 相關文章 PubMed 推理

這項研究發現,結合 soft prompt-based learning 和大型語言模型(像 GatorTronGPT),能大幅提升從不同醫院和疾病的臨床文本中萃取社會健康決定因素(SDoH)的效果。經過 prompt-tuning 的 GatorTronGPT,F1 分數最高比傳統 fine-tuned 模型多出 21.8%,顯示它在跨領域應用上表現更好。 相關文章 PubMed 推理

作者開發了一套系統,能自動從病例報告中擷取並標註臨床事件的時間點,轉成時間序列資料。比較人工和大型語言模型(LLM)標註結果,發現LLM在事件回溯表現普通,但在時間標註上很準確。這研究提供了分析臨床時間序列的新工具和基準,程式碼已開源於GitHub。 相關文章 PubMed 推理

這項研究測試了一款專為美國非裔族群設計的口腔癌AI聊天機器人,專家普遍認為它資訊正確、好用(正面回饋超過83%),但建議加強開場說明、介面簡單化、無障礙設計及專業術語解釋。整體來說,這個聊天機器人有助提升健康知識,減少健康不平等。 相關文章 PubMed 推理