Improving large language model applications in biomedicine with retrieval-augmented generation: a systematic review, meta-analysis, and clinical development guidelines.
利用檢索增強生成技術改善生物醫學中的大型語言模型應用：系統性回顧、統合分析及臨床發展指導方針。 J Am Med Inform Assoc 2025-01-15

本研究綜合了近期在生物醫學領域中有關檢索增強生成（RAG）和大型語言模型（LLMs）的研究，旨在提供臨床發展的指導方針。透過系統文獻回顧和統合分析，研究納入了335項研究中的20項，結果顯示RAG顯著提升了模型表現，勝算比為1.35（P = .001）。報告詳細說明了臨床任務及評估方法，並提出在臨床環境中實施增強LLM的指導方針。未來研究應聚焦於RAG的整合與應用。 PubMed DOI

BiomedRAG: A retrieval augmented large language model for biomedicine.
BiomedRAG：一種用於生物醫學的檢索增強大型語言模型。 J Biomed Inform 2025-01-15

檢索增強生成（RAG）透過從資料庫中檢索知識來提升大型語言模型（LLMs）的表現，但傳統方法在檢索句子或段落時可能會引入噪音。為了解決這個問題，我們提出了BiomedRAG框架，將自動檢索的區塊文件直接輸入LLM。經過在四個生物醫學自然語言處理任務和八個數據集的評估，BiomedRAG的表現平均提升了9.95%，並且在多項基準上達到最先進的結果，超越了4.97%。這個框架為生物醫學領域的LLM應用提供了更準確且可調整的方法。 PubMed DOI

From RAGs to riches: Utilizing large language models to write documents for clinical trials.
從 RAGs 到財富：利用大型語言模型撰寫臨床試驗文件。 Clin Trials 2025-02-27

這項研究評估大型語言模型（LLMs）在生成臨床試驗計畫書的有效性。研究人員使用LLM生成不同疾病和試驗階段的計畫書，並根據臨床思維、透明度、醫學術語和內容相關性四個標準進行評估。結果顯示，LLM在內容相關性和術語方面表現良好，但在臨床思維和透明度上則較差。為提升表現，研究人員採用檢索增強生成（RAG）方法，顯著改善了內容質量，提升了臨床思維和透明度的分數。這表明RAG方法能有效提升LLM在臨床試驗文件撰寫的可用性，並可能改變藥物開發過程。 PubMed DOI

Retrieval-Augmented Generation: Advancing personalized care and research in oncology.
檢索增強生成：推進腫瘤學中的個人化護理與研究。 Eur J Cancer 2025-03-11

檢索增強生成（RAG）透過整合最新數據，提升大型語言模型（LLMs）的準確性與上下文意識。這方法將文本轉為數值嵌入，幫助檢索與使用者查詢相關的數據片段，讓模型的回答更具時效性。在腫瘤學中，RAG能改善治療建議、增強臨床試驗匹配，並加速藥物開發。不過，RAG的效果取決於數據質量，偏見或不完整的信息可能導致錯誤結果，因此需謹慎實施並加強人類監督。 PubMed DOI

Enhancing Large Language Models with Retrieval-augmented Generation: A Radiology-specific Approach.
強化大型語言模型的檢索增強生成：一種放射科特定的方法。 Radiol Artif Intell 2025-03-12

這篇文章探討了一項研究，分析檢索增強生成（RAG）如何提升大型語言模型（LLMs）在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫，無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫，並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示，RAG 顯著提升了 GPT-4 和 Command R+ 的得分，特別是在與 *RadioGraphics* 相關的問題上，成功檢索並引用了相關資料。整體而言，RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI

Biomedical Text Normalization through Generative Modeling.
生物醫學文本標準化透過生成模型。 medRxiv 2025-03-17

這項研究探討了電子健康紀錄（EHRs）中非結構化醫療文本的標準化挑戰，因為這些文本格式不一致。約80%的EHR數據是非結構化的，作者使用大型語言模型（LLMs）來標準化這些文本，開發了四種策略，包括RAGnorm。研究評估了這些策略在三個SNOMED映射的病症術語數據集上的表現，結果顯示RAGnorm在所有數據集中的表現最佳，且在TAC2017任務中獲得88.01的微F1分數，顯示其在標準化生物醫學文本方面的潛力。 PubMed DOI

A dataset for mapping the Japanese drugs to RxNorm standard concepts.
將日本藥物映射到 RxNorm 標準概念的數據集。 Data Brief 2025-03-24

觀察性健康數據科學與資訊（OHDSI）社群專注於利用真實世界醫療數據進行大規模研究。為了參與，必須將當地術語映射到OHDSI標準詞彙，並轉換為觀察性醫療結果夥伴關係共同數據模型（OMOP CDM）。在日本，儘管醫療科技先進，真實世界數據卻未被充分利用，因為國內術語系統與國際標準不一致。研究團隊使用大型語言模型（LLM）成功將日本藥品數據映射到RxNorm，並經專家驗證，這對藥物流行病學及相關研究非常有價值。 PubMed DOI

Retrieval-augmented generation enhances large language model performance on the Japanese orthopedic board examination.
檢索增強生成提升大型語言模型在日本骨科考試中的表現。 J Orthop Sci 2025-03-29

這項研究探討檢索增強生成（RAG）對大型語言模型（LLMs）在醫學領域的影響，特別針對2024年日本骨科專家考試。研究團隊建立了專門資料庫，評估了GPT-3.5 Turbo、GPT-4o和o1-preview的表現。結果顯示，GPT-3.5 Turbo使用RAG後準確率未見提升，仍為28%；而GPT-4o和o1-preview的準確率分別從62%和67%提升至72%和84%。分析指出，GPT-3.5 Turbo在利用檢索數據上表現不佳，顯示其推理能力不足。總體而言，RAG顯著提升了GPT-4o和o1-preview的表現，特別是o1-preview達到臨床實踐的水準。 PubMed DOI

Comparative Analysis of ChatGPT-4 for Automated Mapping of Local Medical Terminologies to SNOMED CT.
ChatGPT-4 用於自動對應在地醫學術語至 SNOMED CT 的比較分析 Stud Health Technol Inform 2025-05-17

這項研究比較四種GPT-4方法，把韓國醫院的診斷用語自動對應到SNOMED CT。結果顯示，RAG模型表現最好，有96.2%能成功對應，完全吻合率也最高。RAG的結構性錯誤率最低，但在細節準確度上還有進步空間。整體來說，AI輔助有助於醫療資料標準化，但臨床驗證還需加強。 PubMed DOI

Biomedical text normalization through generative modeling.
透過生成式建模進行生物醫學文本正規化 J Biomed Inform 2025-05-17

這項研究比較了多種大型語言模型（LLM）方法，把電子病歷的非結構化醫療文本標準化成臨床術語。結果發現，檢索增強生成（RAGnorm）方法表現最穩定、準確度最高，即使沒訓練資料也很有效。這類檢索型LLM在生醫文本標準化上很有潛力，值得持續發展與應用。 PubMed DOI

原始文章

站上相關主題文章列表