Improving large language model applications in biomedicine with retrieval-augmented generation: a systematic review, meta-analysis, and clinical development guidelines.
利用檢索增強生成技術改善生物醫學中的大型語言模型應用：系統性回顧、統合分析及臨床發展指導方針。 J Am Med Inform Assoc 2025-01-15

本研究綜合了近期在生物醫學領域中有關檢索增強生成（RAG）和大型語言模型（LLMs）的研究，旨在提供臨床發展的指導方針。透過系統文獻回顧和統合分析，研究納入了335項研究中的20項，結果顯示RAG顯著提升了模型表現，勝算比為1.35（P = .001）。報告詳細說明了臨床任務及評估方法，並提出在臨床環境中實施增強LLM的指導方針。未來研究應聚焦於RAG的整合與應用。 PubMed DOI

Leveraging Large Language Models to Generate Clinical Histories for Oncologic Imaging Requisitions.
利用大型語言模型生成腫瘤影像檢查申請的臨床歷史。 Radiology 2025-02-04

這項研究探討大型語言模型（LLMs）在自動生成腫瘤影像檢查申請的臨床歷史的應用，資料來自207名接受CT掃描的癌症患者。研究顯示，GPT-4在提取關鍵腫瘤學參數方面表現優異，F1分數達0.983。LLM生成的歷史中，主要診斷、急性症狀及相關手術的出現頻率均高於原始歷史，且差異具統計意義。放射科醫生更偏好LLM生成的歷史，認為其提供更完整的解讀，降低傷害風險。總之，LLM能準確創建全面的腫瘤影像臨床歷史，受到醫生青睞。 PubMed DOI

Radiology Report Annotation Using Generative Large Language Models: Comparative Analysis.
使用生成大型語言模型的放射學報告註釋：比較分析。 Int J Biomed Imaging 2025-02-19

最近大型語言模型（LLMs）如GPT-3.5和GPT-4在醫療領域的應用引起關注。本研究比較了這些模型在註解放射學報告及生成胸部CT印象的表現，旨在協助醫療專業人員處理日常文檔任務。研究使用了上下文學習和檢索增強生成等方法，並透過多種指標進行評估。結果顯示，GPT-4在性能上優於GPT-3.5，且提示設計對結果影響顯著。研究建議在醫療實踐中整合這些先進模型，以提升文檔效率與準確性。 PubMed DOI

Enhancing Large Language Models with Retrieval-augmented Generation: A Radiology-specific Approach.
強化大型語言模型的檢索增強生成：一種放射科特定的方法。 Radiol Artif Intell 2025-03-12

這篇文章探討了一項研究，分析檢索增強生成（RAG）如何提升大型語言模型（LLMs）在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫，無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫，並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示，RAG 顯著提升了 GPT-4 和 Command R+ 的得分，特別是在與 *RadioGraphics* 相關的問題上，成功檢索並引用了相關資料。整體而言，RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI

[Integration of large language models into the clinic : Revolution in analysing and processing patient data to increase efficiency and quality in radiology].
大型語言模型在臨床中的整合：革命性地分析和處理患者數據，以提高放射學的效率和質量。 Radiologie (Heidelb) 2025-03-12

大型語言模型（LLMs）如ChatGPT、Llama和Claude，正在改變醫療保健，特別是在放射科。最近，弗賴堡和巴塞爾大學醫院的研究顯示，這些系統能有效整合影像存檔與傳輸系統（PACS）和電子健康紀錄（EHR），提升醫師效率，縮短報告時間，並自動化例行任務。研究結果顯示，LLMs不僅提高了診斷質量，還促進了跨學科合作。未來應著重增強透明度和擴大應用範圍，確保遵守倫理和法律標準。 PubMed DOI

Performance of large language models for CAD-RADS 2.0 classification derived from cardiac CT reports.
大型語言模型在心臟CT報告中對CAD-RADS 2.0分類的表現。 J Cardiovasc Comput Tomogr 2025-04-10

這項研究評估大型語言模型（LLMs）自動生成CAD-RADS 2.0分數的能力，對於疾病描述和臨床決策非常重要。研究分析了200份心臟CT報告，使用了多種先進的LLMs，包括GPT-3.5、GPT-4o、Mistral 7b、Mixtral 8 × 7b和不同版本的Llama3。結果顯示，GPT-4o和Llama3 70b的準確率最高，分別為93%和92.5%。這些發現顯示，增強上下文學習的模型能有效生成CAD-RADS 2.0分數，提高心臟CT報告的效率與一致性，且開源模型在數據安全上也具優勢。 PubMed DOI

RadSearch, a Semantic Search Model for Accurate Radiology Report Retrieval with Large Language Model Integration.
RadSearch：結合大型語言模型的精確放射學報告語意搜尋模型 Radiology 2025-04-15

研究團隊開發了一套新方法，訓練出比傳統關鍵字或現有語意模型更準確的放射科報告搜尋系統 RadSearch。這系統在臨床應用上表現更好，結合大型語言模型後，診斷也更精確，有助提升臨床效率和報告搜尋的實用性。 PubMed DOI

Comparison of Large Language Models' Performance on 600 Nuclear Medicine Technology Board Examination-Style Questions.
大型語言模型在600題核醫技術師國家考試題型上的表現比較 J Nucl Med Technol 2025-05-09

這項研究比較多款大型語言模型（LLM）在核子醫學題目的表現，發現結合檢索增強生成（RAG）的 GPT-4o 準確率最高。RAG 整體有助提升答題表現。雖然 LLM 在教育和臨床輔助有潛力，但對複雜指引和影像題還不夠理想，未來還需再優化才能安心用於醫療領域。 PubMed DOI

Retrieval-Augmented Generation with Large Language Models in Radiology: From Theory to Practice.
放射科中結合大型語言模型的檢索增強生成：從理論到實務 Radiol Artif Intell 2025-06-04

大型語言模型能幫助放射科減輕工作量，但還有像是亂編內容和資訊來源不明的問題。結合RAG技術能提升可靠性，但面對大量或複雜資料時還需改進。本文回顧LLMs最新進展及放射科應用案例，並提出未來研究方向。 PubMed DOI

Enhancing Pulmonary Disease Prediction Using Large Language Models With Feature Summarization and Hybrid Retrieval-Augmented Generation: Multicenter Methodological Study Based on Radiology Report.
利用特徵摘要與混合檢索增強生成（Hybrid Retrieval-Augmented Generation），結合大型語言模型提升肺部疾病預測：基於放射報告的多中心方法學研究 J Med Internet Res 2025-06-11

這項研究提出結合特徵摘要、思路鏈推理和混合型RAG架構的新提示工程方法，能提升大型語言模型判讀胸部CT報告、診斷肺部疾病的準確度。用2,965份報告測試，結果比傳統深度學習和其他提示法更準，外部驗證也表現優異。此方法不僅提升可解釋性，也有助臨床更精確診斷。 PubMed DOI

原始文章

站上相關主題文章列表