原始文章

這項研究比較了多種大型語言模型(LLM)方法,把電子病歷的非結構化醫療文本標準化成臨床術語。結果發現,檢索增強生成(RAGnorm)方法表現最穩定、準確度最高,即使沒訓練資料也很有效。這類檢索型LLM在生醫文本標準化上很有潛力,值得持續發展與應用。 PubMed DOI


站上相關主題文章列表

這項研究針對將非結構化醫療文本轉換為結構化格式的挑戰,提出了一個自動化的本地流程,確保使用開源大型語言模型(LLMs)時能維護數據隱私。研究針對包含敏感健康資訊的德語醫療文件進行測試,結果顯示在800份非結構化醫療報告中,數據提取的準確率高達90%,表現優於醫生和醫學生的手動提取。這顯示該流程能有效提升數據可用性,同時保障隱私。 PubMed DOI

這項研究探討增強檢索生成(RAG)的大型語言模型(LLMs)在急診科臨床紀錄中生成ICD-10-CM代碼的有效性,並與醫療提供者進行比較。研究基於Mount Sinai Health System的500次急診就診數據,發現RAG增強的LLMs在準確性和特異性上均優於醫療提供者,且GPT-4的表現尤為突出。即使是較小的模型如Llama-3.1-70B,經過RAG後也顯示出顯著提升。這顯示生成式人工智慧在改善醫療編碼準確性及減少行政負擔方面的潛力。 PubMed DOI

本研究綜合了近期在生物醫學領域中有關檢索增強生成(RAG)和大型語言模型(LLMs)的研究,旨在提供臨床發展的指導方針。透過系統文獻回顧和統合分析,研究納入了335項研究中的20項,結果顯示RAG顯著提升了模型表現,勝算比為1.35(P = .001)。報告詳細說明了臨床任務及評估方法,並提出在臨床環境中實施增強LLM的指導方針。未來研究應聚焦於RAG的整合與應用。 PubMed DOI

檢索增強生成(RAG)透過從資料庫中檢索知識來提升大型語言模型(LLMs)的表現,但傳統方法在檢索句子或段落時可能會引入噪音。為了解決這個問題,我們提出了BiomedRAG框架,將自動檢索的區塊文件直接輸入LLM。經過在四個生物醫學自然語言處理任務和八個數據集的評估,BiomedRAG的表現平均提升了9.95%,並且在多項基準上達到最先進的結果,超越了4.97%。這個框架為生物醫學領域的LLM應用提供了更準確且可調整的方法。 PubMed DOI

這項研究評估大型語言模型(LLMs)在生成臨床試驗計畫書的有效性。研究人員使用LLM生成不同疾病和試驗階段的計畫書,並根據臨床思維、透明度、醫學術語和內容相關性四個標準進行評估。結果顯示,LLM在內容相關性和術語方面表現良好,但在臨床思維和透明度上則較差。為提升表現,研究人員採用檢索增強生成(RAG)方法,顯著改善了內容質量,提升了臨床思維和透明度的分數。這表明RAG方法能有效提升LLM在臨床試驗文件撰寫的可用性,並可能改變藥物開發過程。 PubMed DOI

檢索增強生成(RAG)透過整合最新數據,提升大型語言模型(LLMs)的準確性與上下文意識。這方法將文本轉為數值嵌入,幫助檢索與使用者查詢相關的數據片段,讓模型的回答更具時效性。在腫瘤學中,RAG能改善治療建議、增強臨床試驗匹配,並加速藥物開發。不過,RAG的效果取決於數據質量,偏見或不完整的信息可能導致錯誤結果,因此需謹慎實施並加強人類監督。 PubMed DOI

這項研究探討了電子健康紀錄(EHRs)中非結構化醫療文本的標準化挑戰,因為這些文本格式不一致。約80%的EHR數據是非結構化的,作者使用大型語言模型(LLMs)來標準化這些文本,開發了四種策略,包括RAGnorm。研究評估了這些策略在三個SNOMED映射的病症術語數據集上的表現,結果顯示RAGnorm在所有數據集中的表現最佳,且在TAC2017任務中獲得88.01的微F1分數,顯示其在標準化生物醫學文本方面的潛力。 PubMed DOI

這項研究探討了基於GPT-4的檢索增強生成(RAG)模型在術前評估中的有效性。研究測試了十個大型語言模型,生成超過3,200個回應,並與近450個人類答案進行比較。結果顯示,使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%,明顯高於人類的86.6%,且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

這項研究比較四種GPT-4方法,把韓國醫院的診斷用語自動對應到SNOMED CT。結果顯示,RAG模型表現最好,有96.2%能成功對應,完全吻合率也最高。RAG的結構性錯誤率最低,但在細節準確度上還有進步空間。整體來說,AI輔助有助於醫療資料標準化,但臨床驗證還需加強。 PubMed DOI

這篇綜述主要討論 RAG 技術如何應用在醫療領域的大型語言模型,並整理現有資料集、技術和評估方式。多數研究用英文或中文資料,且偏好 GPT-3.5/4 這類專有模型。現階段缺乏統一的評估標準,對倫理問題的討論也不夠。未來需要更多研究,確保 RAG 在醫療應用上既安全又有效。 PubMed DOI