BiomedRAG: A retrieval augmented large language model for biomedicine.
BiomedRAG：一種用於生物醫學的檢索增強大型語言模型。 J Biomed Inform 2025-01-15

檢索增強生成（RAG）透過從資料庫中檢索知識來提升大型語言模型（LLMs）的表現，但傳統方法在檢索句子或段落時可能會引入噪音。為了解決這個問題，我們提出了BiomedRAG框架，將自動檢索的區塊文件直接輸入LLM。經過在四個生物醫學自然語言處理任務和八個數據集的評估，BiomedRAG的表現平均提升了9.95%，並且在多項基準上達到最先進的結果，超越了4.97%。這個框架為生物醫學領域的LLM應用提供了更準確且可調整的方法。 PubMed DOI

From RAGs to riches: Utilizing large language models to write documents for clinical trials.
從 RAGs 到財富：利用大型語言模型撰寫臨床試驗文件。 Clin Trials 2025-02-27

這項研究評估大型語言模型（LLMs）在生成臨床試驗計畫書的有效性。研究人員使用LLM生成不同疾病和試驗階段的計畫書，並根據臨床思維、透明度、醫學術語和內容相關性四個標準進行評估。結果顯示，LLM在內容相關性和術語方面表現良好，但在臨床思維和透明度上則較差。為提升表現，研究人員採用檢索增強生成（RAG）方法，顯著改善了內容質量，提升了臨床思維和透明度的分數。這表明RAG方法能有效提升LLM在臨床試驗文件撰寫的可用性，並可能改變藥物開發過程。 PubMed DOI

Evaluating base and retrieval augmented LLMs with document or online support for evidence based neurology.
評估具有文件或線上支持的基礎及檢索增強型 LLMs 在證據基礎神經學中的應用。 NPJ Digit Med 2025-03-04

這項研究探討大型語言模型（LLMs）和檢索增強生成（RAG）系統在管理基於證據的信息的效果，特別針對13項神經學指導方針和130個問題。結果顯示性能差異明顯，雖然RAG系統在準確性上有所提升，但仍可能產生有害回應。此外，RAG系統在處理案例型問題時表現不如知識型問題。研究強調需要進一步改進和規範，以確保RAG增強的LLMs在臨床上的安全使用。 PubMed DOI

Retrieval-Augmented Generation: Advancing personalized care and research in oncology.
檢索增強生成：推進腫瘤學中的個人化護理與研究。 Eur J Cancer 2025-03-11

檢索增強生成（RAG）透過整合最新數據，提升大型語言模型（LLMs）的準確性與上下文意識。這方法將文本轉為數值嵌入，幫助檢索與使用者查詢相關的數據片段，讓模型的回答更具時效性。在腫瘤學中，RAG能改善治療建議、增強臨床試驗匹配，並加速藥物開發。不過，RAG的效果取決於數據質量，偏見或不完整的信息可能導致錯誤結果，因此需謹慎實施並加強人類監督。 PubMed DOI

Enhancing Large Language Models with Retrieval-augmented Generation: A Radiology-specific Approach.
強化大型語言模型的檢索增強生成：一種放射科特定的方法。 Radiol Artif Intell 2025-03-12

這篇文章探討了一項研究，分析檢索增強生成（RAG）如何提升大型語言模型（LLMs）在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫，無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫，並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示，RAG 顯著提升了 GPT-4 和 Command R+ 的得分，特別是在與 *RadioGraphics* 相關的問題上，成功檢索並引用了相關資料。整體而言，RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI

Retrieval-augmented generation enhances large language model performance on the Japanese orthopedic board examination.
檢索增強生成提升大型語言模型在日本骨科考試中的表現。 J Orthop Sci 2025-03-29

這項研究探討檢索增強生成（RAG）對大型語言模型（LLMs）在醫學領域的影響，特別針對2024年日本骨科專家考試。研究團隊建立了專門資料庫，評估了GPT-3.5 Turbo、GPT-4o和o1-preview的表現。結果顯示，GPT-3.5 Turbo使用RAG後準確率未見提升，仍為28%；而GPT-4o和o1-preview的準確率分別從62%和67%提升至72%和84%。分析指出，GPT-3.5 Turbo在利用檢索數據上表現不佳，顯示其推理能力不足。總體而言，RAG顯著提升了GPT-4o和o1-preview的表現，特別是o1-preview達到臨床實踐的水準。 PubMed DOI

Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness.
10 種大型語言模型的檢索增強生成及其在評估醫療適應性中的普遍性。 NPJ Digit Med 2025-04-04

這項研究探討了基於GPT-4的檢索增強生成（RAG）模型在術前評估中的有效性。研究測試了十個大型語言模型，生成超過3,200個回應，並與近450個人類答案進行比較。結果顯示，使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%，明顯高於人類的86.6%，且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

Enhancing medical AI with retrieval-augmented generation: A mini narrative review.
以檢索增強生成（retrieval-augmented generation）提升醫療AI：迷你敘述性回顧 Digit Health 2025-05-09

RAG（檢索增強生成）能結合外部資料，讓大型語言模型在醫療領域的回應更精確，像是診斷、臨床決策和資訊擷取都更有幫助。研究發現，RAG在解讀指引、診斷和臨床試驗篩選等表現都比傳統方法好。不過，目前在評估標準、成本和減少AI幻覺上還有待加強，未來還需要持續優化並強化與醫療專業的合作。 PubMed DOI

Retrieval Augmented Generation: What Works and Lessons Learned.
檢索增強生成（Retrieval Augmented Generation）：有效方法與經驗教訓 Stud Health Technol Inform 2025-05-13

這篇研究說明，透過RAG技術給大型語言模型補充相關背景資訊，可以明顯提升醫療問答的準確度。作者也分享了實驗心得和優化建議，對想提升LLM醫療應用表現的研究人員很有幫助。 PubMed DOI

Retrieval augmented generation for large language models in healthcare: A systematic review.
醫療領域中大型語言模型的檢索增強生成：系統性回顧 PLOS Digit Health 2025-06-11

這篇綜述主要討論 RAG 技術如何應用在醫療領域的大型語言模型，並整理現有資料集、技術和評估方式。多數研究用英文或中文資料，且偏好 GPT-3.5/4 這類專有模型。現階段缺乏統一的評估標準，對倫理問題的討論也不夠。未來需要更多研究，確保 RAG 在醫療應用上既安全又有效。 PubMed DOI

原始文章

站上相關主題文章列表