Improving large language model applications in biomedicine with retrieval-augmented generation: a systematic review, meta-analysis, and clinical development guidelines.
利用檢索增強生成技術改善生物醫學中的大型語言模型應用：系統性回顧、統合分析及臨床發展指導方針。 J Am Med Inform Assoc 2025-01-15

本研究綜合了近期在生物醫學領域中有關檢索增強生成（RAG）和大型語言模型（LLMs）的研究，旨在提供臨床發展的指導方針。透過系統文獻回顧和統合分析，研究納入了335項研究中的20項，結果顯示RAG顯著提升了模型表現，勝算比為1.35（P = .001）。報告詳細說明了臨床任務及評估方法，並提出在臨床環境中實施增強LLM的指導方針。未來研究應聚焦於RAG的整合與應用。 PubMed DOI

The use of large language models to enhance cancer clinical trial educational materials.
利用大型語言模型增強癌症臨床試驗教育材料的應用。 JNCI Cancer Spectr 2025-02-08

這項研究探討了大型語言模型（LLMs），特別是GPT-4，在製作癌症臨床試驗教育內容的潛力，旨在提升患者的理解。研究從ClinicalTrials.gov獲取知情同意書，生成簡短摘要和多選題，並透過患者調查和眾包註釋來評估其有效性。結果顯示，摘要內容可讀且具資訊性，患者認為有助於理解臨床試驗並提高參與意願。雖然多選題的準確性高，但當要求提供未明確列出的資訊時，GPT-4的準確性較低。整體而言，研究顯示GPT-4能有效生成患者友好的教育材料，但仍需人類監督以確保準確性。 PubMed DOI

Transforming Informed Consent Generation Using Large Language Models: Mixed Methods Study.
利用大型語言模型轉變知情同意生成：混合方法研究。 JMIR Med Inform 2025-02-13

這項研究探討使用 Mistral 8x22B 大型語言模型 (LLM) 改善臨床試驗的知情同意書 (ICFs) 撰寫，針對複雜性和法律術語問題進行分析。研究中，四個臨床試驗方案的 ICF 由 LLM 生成，並由八位專家評估。結果顯示，LLM 生成的 ICF 在準確性和完整性上與人類版本相似，但在可讀性和可理解性上表現更佳，且在可行性上獲得滿分。整體而言，LLM 顯示出提升 ICF 可及性和清晰度的潛力，可能成為改善參與者理解的有效解決方案。 PubMed DOI

Exploration of Using an Open-Source Large Language Model for Analyzing Trial Information: A Case Study of Clinical Trials With Decentralized Elements.
探索使用開源大型語言模型分析試驗資訊：一個包含去中心化元素的臨床試驗案例研究。 Clin Transl Sci 2025-03-03

這項研究探討了使用開源大型語言模型Llama 3，分析2018至2023年間去中心化臨床試驗（DCTs）的趨勢，並解決試驗登記中術語不標準的問題。研究人員從ClinicalTrials.gov獲取數據，使用三個不同版本的Llama 3模型進行DCT分類和提取去中心化元素。結果顯示，微調模型能提高敏感性，但正確預測值較低，需專注於DCT術語。最終識別出692個DCT，主要為第二期試驗，顯示大型語言模型在分析非結構化臨床數據的潛力，並強調管理模型偏見的重要性。 PubMed DOI

Evaluating base and retrieval augmented LLMs with document or online support for evidence based neurology.
評估具有文件或線上支持的基礎及檢索增強型 LLMs 在證據基礎神經學中的應用。 NPJ Digit Med 2025-03-04

這項研究探討大型語言模型（LLMs）和檢索增強生成（RAG）系統在管理基於證據的信息的效果，特別針對13項神經學指導方針和130個問題。結果顯示性能差異明顯，雖然RAG系統在準確性上有所提升，但仍可能產生有害回應。此外，RAG系統在處理案例型問題時表現不如知識型問題。研究強調需要進一步改進和規範，以確保RAG增強的LLMs在臨床上的安全使用。 PubMed DOI

Transforming hematological research documentation with large language models: an approach to scientific writing and data analysis.
利用大型語言模型轉變血液學研究文獻：科學寫作與數據分析的方法。 Blood Res 2025-03-06

大型語言模型（LLMs），像是ChatGPT，已經徹底改變了學術界的科學寫作與研究，提供了全方位的支援。生成式人工智慧（GAI）工具在假設形成、方法設計、數據分析到手稿準備等各階段都有所改善。這篇評論專注於LLMs在血液學研究中的應用，特別提到提示工程和檢索增強生成（RAG）框架等技術。這些技術能幫助研究人員創造更準確的內容，並降低錯誤資訊的風險。儘管GAI工具提升了研究質量，但也強調了科學誠信、倫理考量及隱私保護的重要性。 PubMed DOI

Retrieval-Augmented Generation: Advancing personalized care and research in oncology.
檢索增強生成：推進腫瘤學中的個人化護理與研究。 Eur J Cancer 2025-03-11

檢索增強生成（RAG）透過整合最新數據，提升大型語言模型（LLMs）的準確性與上下文意識。這方法將文本轉為數值嵌入，幫助檢索與使用者查詢相關的數據片段，讓模型的回答更具時效性。在腫瘤學中，RAG能改善治療建議、增強臨床試驗匹配，並加速藥物開發。不過，RAG的效果取決於數據質量，偏見或不完整的信息可能導致錯誤結果，因此需謹慎實施並加強人類監督。 PubMed DOI

Large language models for automating clinical trial matching.
大型語言模型在自動化臨床試驗匹配中的應用。 Curr Opin Urol 2025-03-21

生成式人工智慧（GAI）技術，特別是大型語言模型（LLMs），在醫學領域的應用越來越普遍，尤其是在病人與臨床試驗配對方面。研究顯示，LLMs能有效匹配病人的健康紀錄與臨床試驗資格標準，並取得良好結果。雖然自動化配對有助於提升病人參與率和減輕醫療工作負擔，但也面臨挑戰，如可能帶來虛假希望、導航困難及需人類監督等問題。進一步研究對驗證LLM在腫瘤學中的安全性和有效性至關重要。 PubMed DOI

Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness.
10 種大型語言模型的檢索增強生成及其在評估醫療適應性中的普遍性。 NPJ Digit Med 2025-04-04

這項研究探討了基於GPT-4的檢索增強生成（RAG）模型在術前評估中的有效性。研究測試了十個大型語言模型，生成超過3,200個回應，並與近450個人類答案進行比較。結果顯示，使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%，明顯高於人類的86.6%，且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

RAGing ahead in rheumatology: new language model architectures to tame artificial intelligence.
在風濕病學領域邁步向前：以新型語言模型架構馴服人工智慧 Ther Adv Musculoskelet Dis 2025-04-28

AI大型語言模型正改變風濕病學，但準確度和專業知識有限。RAG技術能結合即時專業資料，提升準確性、減少幻覺，並增強可信度。雖然目前在風濕病學應用還不多，但在臨床指引查詢、病史摘要、試驗招募和衛教等方面很有潛力，也有資料隱私優勢。整體來說，RAG是更可靠且具前景的AI應用方式。 PubMed DOI

原始文章

站上相關主題文章列表