Mapping Drug Terms via Integration of a Retrieval-Augmented Generation Algorithm with a Large Language Model.
藥物術語的映射：通過將檢索增強生成算法與大型語言模型整合。 Healthc Inform Res 2024-11-17

這項研究探討結合檢索增強生成（RAG）模型與大型語言模型（LLM），以提升國際詞彙中藥物名稱對應的準確性。研究過程中，將藥物成分名稱翻譯成英文，並使用日本藥品名稱，從OHDSI標準詞彙中提取藥物概念。結果顯示，LLM + RAG的組合表現顯著優於傳統方法，命中率超過90%，而基準僅64%。此外，r-precision指標也從23%提升至41%至50%。整體而言，RAG與LLM的整合提供了更有效的全球藥物資訊對應方法。 PubMed DOI

Improving large language model applications in biomedicine with retrieval-augmented generation: a systematic review, meta-analysis, and clinical development guidelines.
利用檢索增強生成技術改善生物醫學中的大型語言模型應用：系統性回顧、統合分析及臨床發展指導方針。 J Am Med Inform Assoc 2025-01-15

本研究綜合了近期在生物醫學領域中有關檢索增強生成（RAG）和大型語言模型（LLMs）的研究，旨在提供臨床發展的指導方針。透過系統文獻回顧和統合分析，研究納入了335項研究中的20項，結果顯示RAG顯著提升了模型表現，勝算比為1.35（P = .001）。報告詳細說明了臨床任務及評估方法，並提出在臨床環境中實施增強LLM的指導方針。未來研究應聚焦於RAG的整合與應用。 PubMed DOI

BiomedRAG: A retrieval augmented large language model for biomedicine.
BiomedRAG：一種用於生物醫學的檢索增強大型語言模型。 J Biomed Inform 2025-01-15

檢索增強生成（RAG）透過從資料庫中檢索知識來提升大型語言模型（LLMs）的表現，但傳統方法在檢索句子或段落時可能會引入噪音。為了解決這個問題，我們提出了BiomedRAG框架，將自動檢索的區塊文件直接輸入LLM。經過在四個生物醫學自然語言處理任務和八個數據集的評估，BiomedRAG的表現平均提升了9.95%，並且在多項基準上達到最先進的結果，超越了4.97%。這個框架為生物醫學領域的LLM應用提供了更準確且可調整的方法。 PubMed DOI

Integrating retrieval-augmented generation for enhanced personalized physician recommendations in web-based medical services: model development study.
整合檢索增強生成以提升網路醫療服務中的個性化醫生推薦：模型開發研究。 Front Public Health 2025-02-13

這項研究開發了一個基於檢索增強生成的醫生推薦模型（RAGPR），旨在提升網路醫療服務中的個人化推薦。研究針對排班人員手動分診的限制，使用廈門大學第一附屬醫院的646,383份諮詢紀錄進行評估。結果顯示，SBERT和OpenAI的表現優異，F1分數分別達到95%和96%。在大型語言模型中，GPT-4o表現最佳，F1分數為95%。整體而言，RAGPR模型在提升醫療服務的準確性和個人化方面展現良好潛力，提供可擴展的病患與醫生匹配解決方案。 PubMed DOI

From RAGs to riches: Utilizing large language models to write documents for clinical trials.
從 RAGs 到財富：利用大型語言模型撰寫臨床試驗文件。 Clin Trials 2025-02-27

這項研究評估大型語言模型（LLMs）在生成臨床試驗計畫書的有效性。研究人員使用LLM生成不同疾病和試驗階段的計畫書，並根據臨床思維、透明度、醫學術語和內容相關性四個標準進行評估。結果顯示，LLM在內容相關性和術語方面表現良好，但在臨床思維和透明度上則較差。為提升表現，研究人員採用檢索增強生成（RAG）方法，顯著改善了內容質量，提升了臨床思維和透明度的分數。這表明RAG方法能有效提升LLM在臨床試驗文件撰寫的可用性，並可能改變藥物開發過程。 PubMed DOI

Evaluating base and retrieval augmented LLMs with document or online support for evidence based neurology.
評估具有文件或線上支持的基礎及檢索增強型 LLMs 在證據基礎神經學中的應用。 NPJ Digit Med 2025-03-04

這項研究探討大型語言模型（LLMs）和檢索增強生成（RAG）系統在管理基於證據的信息的效果，特別針對13項神經學指導方針和130個問題。結果顯示性能差異明顯，雖然RAG系統在準確性上有所提升，但仍可能產生有害回應。此外，RAG系統在處理案例型問題時表現不如知識型問題。研究強調需要進一步改進和規範，以確保RAG增強的LLMs在臨床上的安全使用。 PubMed DOI

Enhancing data quality in medical concept normalization through large language models.
透過大型語言模型提升醫學概念標準化中的數據質量。 J Biomed Inform 2025-04-03

這項研究聚焦於醫療概念標準化（MCN），強調數據質量對其表現的重要性，並提出一個框架來提升數據質量，利用像ChatGPT這樣的大型語言模型。研究評估了MCN數據集的質量，並透過ChatGPT進行數據增強，分析生成數據的正確性。實驗探討數據質量對MCN模型的影響，並指出增強過程中的數據重複問題。最終，研究認為少樣本學習結合適當的上下文是提升MCN數據質量的有效方法，並提供了寶貴的見解。如需詳情，可參考提供的GitHub連結。 PubMed DOI

Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness.
10 種大型語言模型的檢索增強生成及其在評估醫療適應性中的普遍性。 NPJ Digit Med 2025-04-04

這項研究探討了基於GPT-4的檢索增強生成（RAG）模型在術前評估中的有效性。研究測試了十個大型語言模型，生成超過3,200個回應，並與近450個人類答案進行比較。結果顯示，使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%，明顯高於人類的86.6%，且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

Comparative Analysis of ChatGPT-4 for Automated Mapping of Local Medical Terminologies to SNOMED CT.
ChatGPT-4 用於自動對應在地醫學術語至 SNOMED CT 的比較分析 Stud Health Technol Inform 2025-05-17

這項研究比較四種GPT-4方法，把韓國醫院的診斷用語自動對應到SNOMED CT。結果顯示，RAG模型表現最好，有96.2%能成功對應，完全吻合率也最高。RAG的結構性錯誤率最低，但在細節準確度上還有進步空間。整體來說，AI輔助有助於醫療資料標準化，但臨床驗證還需加強。 PubMed DOI

Biomedical text normalization through generative modeling.
透過生成式建模進行生物醫學文本正規化 J Biomed Inform 2025-05-17

這項研究比較了多種大型語言模型（LLM）方法，把電子病歷的非結構化醫療文本標準化成臨床術語。結果發現，檢索增強生成（RAGnorm）方法表現最穩定、準確度最高，即使沒訓練資料也很有效。這類檢索型LLM在生醫文本標準化上很有潛力，值得持續發展與應用。 PubMed DOI

原始文章

站上相關主題文章列表