Improving large language model applications in biomedicine with retrieval-augmented generation: a systematic review, meta-analysis, and clinical development guidelines.
利用檢索增強生成技術改善生物醫學中的大型語言模型應用：系統性回顧、統合分析及臨床發展指導方針。 J Am Med Inform Assoc 2025-01-15

本研究綜合了近期在生物醫學領域中有關檢索增強生成（RAG）和大型語言模型（LLMs）的研究，旨在提供臨床發展的指導方針。透過系統文獻回顧和統合分析，研究納入了335項研究中的20項，結果顯示RAG顯著提升了模型表現，勝算比為1.35（P = .001）。報告詳細說明了臨床任務及評估方法，並提出在臨床環境中實施增強LLM的指導方針。未來研究應聚焦於RAG的整合與應用。 PubMed DOI

Current applications and challenges in large language models for patient care: a systematic review.
大型語言模型在病患照護中的現行應用與挑戰：系統性回顧。 Commun Med (Lond) 2025-01-21

大型語言模型（LLMs）在臨床實踐中有潛力提升病人教育與賦權，提供更個人化的醫療服務。然而，目前對其在病人照護中的應用資訊仍不夠完整。本系統性回顧分析了2022至2023年間的89項相關研究，主要集中於GPT-3.5和GPT-4，應用於回答醫療問題、生成病人資訊等。研究指出設計和輸出方面的限制，包括缺乏針對醫療的優化及數據透明度等問題。此回顧為LLMs在醫療環境中的應用與評估提供了基礎框架。 PubMed DOI

A systematic review of large language model (LLM) evaluations in clinical medicine.
大型語言模型 (LLM) 在臨床醫學評估中的系統性回顧。 BMC Med Inform Decis Mak 2025-03-07

大型語言模型（LLMs）在臨床醫學中展現出潛力，能改善決策支持、診斷及醫學教育。不過，將其整合進臨床流程需徹底評估，以確保可靠性、安全性及倫理性。本系統性回顧調查了LLMs在臨床環境中的評估方法，發現大多數研究集中於一般領域的LLMs，醫學領域的研究較少。準確性是最常評估的參數。儘管對LLMs的興趣上升，研究中仍存在限制與偏見，未來需建立標準化框架，確保其安全有效地應用於臨床實踐。 PubMed DOI

Retrieval-Augmented Generation: Advancing personalized care and research in oncology.
檢索增強生成：推進腫瘤學中的個人化護理與研究。 Eur J Cancer 2025-03-11

檢索增強生成（RAG）透過整合最新數據，提升大型語言模型（LLMs）的準確性與上下文意識。這方法將文本轉為數值嵌入，幫助檢索與使用者查詢相關的數據片段，讓模型的回答更具時效性。在腫瘤學中，RAG能改善治療建議、增強臨床試驗匹配，並加速藥物開發。不過，RAG的效果取決於數據質量，偏見或不完整的信息可能導致錯誤結果，因此需謹慎實施並加強人類監督。 PubMed DOI

Enhancing Large Language Models with Retrieval-augmented Generation: A Radiology-specific Approach.
強化大型語言模型的檢索增強生成：一種放射科特定的方法。 Radiol Artif Intell 2025-03-12

這篇文章探討了一項研究，分析檢索增強生成（RAG）如何提升大型語言模型（LLMs）在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫，無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫，並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示，RAG 顯著提升了 GPT-4 和 Command R+ 的得分，特別是在與 *RadioGraphics* 相關的問題上，成功檢索並引用了相關資料。整體而言，RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI

A Review of Large Language Models in Medical Education, Clinical Decision Support, and Healthcare Administration.
大型語言模型在醫學教育、臨床決策支持和醫療管理中的綜述。 Healthcare (Basel) 2025-03-28

大型語言模型（LLMs）在醫療保健中展現出顯著潛力，能增強醫學教育、臨床決策支持及醫療管理。文獻回顧顯示，LLMs可作為虛擬病人和個性化導師，並在醫學知識評估中超越初級實習生。在臨床決策中，它們協助診斷和治療建議，但效果因專科而異。此外，LLMs能自動化臨床筆記和報告生成，減輕醫療人員的負擔。然而，仍需解決幻覺、偏見及病人隱私等挑戰。未來的整合需謹慎，並強調倫理與合作。 PubMed DOI

Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness.
10 種大型語言模型的檢索增強生成及其在評估醫療適應性中的普遍性。 NPJ Digit Med 2025-04-04

這項研究探討了基於GPT-4的檢索增強生成（RAG）模型在術前評估中的有效性。研究測試了十個大型語言模型，生成超過3,200個回應，並與近450個人類答案進行比較。結果顯示，使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%，明顯高於人類的86.6%，且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

Enhancing medical AI with retrieval-augmented generation: A mini narrative review.
以檢索增強生成（retrieval-augmented generation）提升醫療AI：迷你敘述性回顧 Digit Health 2025-05-09

RAG（檢索增強生成）能結合外部資料，讓大型語言模型在醫療領域的回應更精確，像是診斷、臨床決策和資訊擷取都更有幫助。研究發現，RAG在解讀指引、診斷和臨床試驗篩選等表現都比傳統方法好。不過，目前在評估標準、成本和減少AI幻覺上還有待加強，未來還需要持續優化並強化與醫療專業的合作。 PubMed DOI

Retrieval Augmented Generation: What Works and Lessons Learned.
檢索增強生成（Retrieval Augmented Generation）：有效方法與經驗教訓 Stud Health Technol Inform 2025-05-13

這篇研究說明，透過RAG技術給大型語言模型補充相關背景資訊，可以明顯提升醫療問答的準確度。作者也分享了實驗心得和優化建議，對想提升LLM醫療應用表現的研究人員很有幫助。 PubMed DOI

Retrieval-Augmented Generation with Large Language Models in Radiology: From Theory to Practice.
放射科中結合大型語言模型的檢索增強生成：從理論到實務 Radiol Artif Intell 2025-06-04

大型語言模型能幫助放射科減輕工作量，但還有像是亂編內容和資訊來源不明的問題。結合RAG技術能提升可靠性，但面對大量或複雜資料時還需改進。本文回顧LLMs最新進展及放射科應用案例，並提出未來研究方向。 PubMed DOI

原始文章

站上相關主題文章列表