Evaluation of large language models performance against humans for summarizing MRI knee radiology reports: A feasibility study.
大型語言模型在摘要 MRI 膝部放射學報告方面與人類表現的評估：可行性研究。 Int J Med Inform 2024-04-14

研究比較了不同大型語言模型在放射學自動摘要生成的效果，重點在於準確的摘要對準確傳達放射學發現至關重要。研究使用T5和BART模型進行微調和零-shot學習，並與RNN進行比較。結果顯示，T5模型在Rouge-L分數達到0.638，且人類評判顯示T5生成的摘要與專業放射科醫師相似度高達70%。研究指出，自然語言處理和語言模型技術的進步有助於提升放射學摘要生成工具，對放射科醫師的工作有所助益。 PubMed DOI

Leveraging Professional Radiologists' Expertise to Enhance LLMs' Evaluation for Radiology Reports.
善用專業放射科醫師的專業知識，以提升對放射學報告的LLM評估。 ArXiv 2024-06-21

人工智慧在放射學報告生成方面有進步，但評估AI報告仍有挑戰。結合放射科醫師專業知識與GPT-3.5、GPT-4等大型語言模型，使用ICIL和CoT推理對齊評估標準。透過回歸模型聚合分數進行比較，實驗結果顯示此方法優於現有指標。穩健性已驗證，將釋出專家註釋以增進AI醫學報告評估品質。 PubMed DOI

Large language models for structured reporting in radiology: past, present, and future.
放射學中結構化報告的大型語言模型：過去、現在與未來。 Eur Radiol 2024-10-22

放射學中的結構化報告（SR）旨在提升報告質量，但採用率仍然不高。近期大型語言模型（LLMs）的進展，特別是GPT-3.5和GPT-4，顯示出自動化SR的潛力。這篇回顧探討了LLMs在放射報告中的應用，包括文檔編寫、翻譯、臨床評估和數據挖掘等四個領域。雖然LLMs能提升SR的效率與準確性，但在臨床實踐中整合時仍需克服算法透明度和訓練數據的挑戰。 PubMed DOI

GPT-Driven Radiology Report Generation with Fine-Tuned Llama 3.
基於 GPT 的放射科報告生成與微調的 Llama 3。 Bioengineering (Basel) 2024-10-25

深度學習在放射學的應用有助於改善診斷，但臨床接受度仍有挑戰。本研究開發了一個基於Llama 3-8B的語言模型，旨在自動生成MRI和CT報告的結論，以協助放射科醫生並提升效率。使用了15,000份來自克拉約瓦醫藥與藥學大學的報告數據進行訓練，並在NVIDIA RTX 3090 GPU上進行微調。結果顯示，模型在生成結論的準確性上表現良好，並獲得放射科醫生的正面評價。未來需解決數據偏見及臨床整合等問題。 PubMed DOI

Multi-modal large language models in radiology: principles, applications, and potential.
放射學中的多模態大型語言模型：原則、應用與潛力。 Abdom Radiol (NY) 2024-12-02

這篇評論探討大型語言模型（LLMs）和多模態大型語言模型（MLLMs）在放射學的進展，強調它們在報告生成、影像解讀、電子健康紀錄摘要等方面的潛力。透過自動化，這些模型能減輕放射科醫師的負擔，提高診斷準確性，並促進跨學科合作，最終提升病人護理品質。不過，評論也指出MLLMs在解讀三維醫學影像及整合影像與文本數據上仍面臨挑戰，並呼籲對評估方法的改進。 PubMed DOI

Large Language Model Ability to Translate CT and MRI Free-Text Radiology Reports Into Multiple Languages.
大型語言模型將 CT 和 MRI 自由文本放射學報告翻譯成多種語言的能力。 Radiology 2024-12-17

這項研究評估大型語言模型（LLMs）在翻譯放射科報告的效果。由於合格翻譯者不足，這對病人護理造成挑戰。研究團隊將100份合成報告翻譯成九種語言，並使用十個LLM進行自動翻譯，結果由18位放射科醫生評估。發現GPT-4的翻譯品質最佳，特別是在英德、英希、英泰和英土語言對上表現突出。雖然LLMs在清晰度和一致性上表現良好，但醫學術語的準確性仍需改進。總體來說，LLMs能有效翻譯放射科報告，但不同模型和語言的表現有所差異。 PubMed DOI

Leveraging Professional Radiologists' Expertise to Enhance LLMs' Evaluation for AI-generated Radiology Reports.
利用專業放射科醫師的專業知識提升 LLMs 對 AI 生成放射科報告的評估。 Proc (IEEE Int Conf Healthc Inform) 2024-12-18

在放射學中，人工智慧（AI）已改善報告生成，但評估這些報告仍具挑戰。傳統評估指標常無法捕捉臨床細微語義，或過於專注細節，影響報告清晰度。為解決此問題，我們結合放射科醫師專業知識與大型語言模型（如GPT-3.5和GPT-4），採用上下文指導學習和思維鏈推理，促進AI與人類報告的比較。實驗顯示，我們的方法在評估準確性上顯著優於現有指標，並計劃公開放射科專家註解，為未來評估建立新基準。 PubMed DOI

Radiology Report Annotation Using Generative Large Language Models: Comparative Analysis.
使用生成大型語言模型的放射學報告註釋：比較分析。 Int J Biomed Imaging 2025-02-19

最近大型語言模型（LLMs）如GPT-3.5和GPT-4在醫療領域的應用引起關注。本研究比較了這些模型在註解放射學報告及生成胸部CT印象的表現，旨在協助醫療專業人員處理日常文檔任務。研究使用了上下文學習和檢索增強生成等方法，並透過多種指標進行評估。結果顯示，GPT-4在性能上優於GPT-3.5，且提示設計對結果影響顯著。研究建議在醫療實踐中整合這些先進模型，以提升文檔效率與準確性。 PubMed DOI

[Integration of large language models into the clinic : Revolution in analysing and processing patient data to increase efficiency and quality in radiology].
大型語言模型在臨床中的整合：革命性地分析和處理患者數據，以提高放射學的效率和質量。 Radiologie (Heidelb) 2025-03-12

大型語言模型（LLMs）如ChatGPT、Llama和Claude，正在改變醫療保健，特別是在放射科。最近，弗賴堡和巴塞爾大學醫院的研究顯示，這些系統能有效整合影像存檔與傳輸系統（PACS）和電子健康紀錄（EHR），提升醫師效率，縮短報告時間，並自動化例行任務。研究結果顯示，LLMs不僅提高了診斷質量，還促進了跨學科合作。未來應著重增強透明度和擴大應用範圍，確保遵守倫理和法律標準。 PubMed DOI

Large Language Model with Region-guided Referring and Grounding for CT Report Generation.
區域引導參考與定位的大型語言模型在 CT 報告生成中的應用。 IEEE Trans Med Imaging 2025-04-11

Reg2RG框架針對CT報告生成的挑戰，專注於特定解剖區域，提升診斷性能。它利用通用分割模組的遮罩捕捉局部特徵，並引入局部特徵解耦（LFD）策略，以低計算成本保持高解析度。框架還實施區域報告對齊（RRA）訓練策略，透過識別參考區域來生成更具可解釋性的報告。大型語言模型（LLM）用作解碼器，從視覺特徵生成報告。實驗結果顯示，Reg2RG在自然語言生成和臨床效能上超越多種先進方法，且代碼已在GitHub公開。 PubMed DOI

原始文章

站上相關主題文章列表