Enhancing chest X-ray datasets with privacy-preserving large language models and multi-type annotations: a data-driven approach for improved classification.
使用保護隱私的大型語言模型和多類型標註增強胸部X光資料集：改進分類的數據驅動方法。 ArXiv 2024-05-07

新方法MAPLEZ利用大型語言模型從胸部X光報告中提取詳細的發現標籤，包含存在、位置、嚴重程度和不確定性等資訊。相較現有方法，MAPLEZ表現更佳，提升模型品質。研究人員提供代碼和標籤以供進一步研究。 PubMed DOI

Multifocal region-assisted cross-modality learning for chest X-ray report generation.
多焦區域輔助的跨模態學習於胸部 X 光報告生成。 Comput Biol Med 2024-10-22

隨著心血管疾病、腫瘤等慢性病的增加，研究人員開始探索生成醫療報告的新方法。近期的研究聚焦於利用大型跨模態模型和自然語言生成技術，來縮短視覺數據（如X光影像）與文本之間的差距。為了解決這些挑戰，我們提出了多焦點區域輔助報告生成網絡（MRARGN），結合ResNet-50模型及注意力機制，提升跨模態信息的匹配，並生成詳細的醫學文本描述。實驗結果顯示，MRARGN在醫療報告生成上表現優於多種現有方法，證明其有效性。 PubMed DOI

Enhancing chest X-ray datasets with privacy-preserving large language models and multi-type annotations: A data-driven approach for improved classification.
利用隱私保護的大型語言模型和多類型註釋增強胸部 X 光數據集：一種數據驅動的改進分類方法。 Med Image Anal 2024-11-15

在胸部X光片的分析中，傳統的標註系統多半只能提供簡單的存在與否標籤，缺乏靈活性。為了解決這個問題，我們推出了MAPLEZ，這是一種利用大型語言模型的創新方法，能從CXR報告中提取更詳細的資訊，包括發現的位置、嚴重程度及醫生的不確定性。研究顯示，MAPLEZ在標註質量上有顯著提升，宏觀F1分數提高3.6%，位置標註更是提升超過20%。此外，結合這些標註後，分類性能也有明顯改善。我們還提供了代碼和標註的訪問權限。 PubMed DOI

Advancement in medical report generation: current practices, challenges, and future directions.
醫學報告生成的進展：當前實踐、挑戰與未來方向。 Med Biol Eng Comput 2024-12-20

醫學影像分析需要放射科醫師的專業知識，但手動報告過程耗時且成本高。為了解決這些問題，研究者提出了多種方法，包括深度學習技術，來協助醫師。系統性文獻回顧顯示，編碼器-解碼器框架是最常用的模型，準確率達92-95%。雖然這些方法展現良好效果，但仍面臨過擬合和數據依賴等挑戰。本文提供了克服這些問題的建議，旨在提升醫學報告生成的準確性與效率，減輕醫師的工作負擔。 PubMed DOI

Automatic medical report generation based on deep learning: A state of the art survey.
基於深度學習的自動醫學報告生成：最新技術綜述。 Comput Med Imaging Graph 2025-01-09

隨著醫學影像使用增加，放射科醫師面臨審查影像和撰寫報告的壓力。為了減輕這負擔並提升病患護理品質，研究者正利用深度學習技術自動生成醫學報告。本文提供自動醫學報告生成的最新進展，重點探討四個領域：報告生成問題的本質、影像數據集介紹、評估指標分析，以及研究分類。還強調現存挑戰並建議未來研究方向，旨在增進對該領域的理解與發展。 PubMed DOI

CXR-LLaVA: a multimodal large language model for interpreting chest X-ray images.
CXR-LLaVA：一種用於解讀胸部 X 光影像的多模態大型語言模型。 Eur Radiol 2025-01-15

這項研究開發了一個名為CXR-LLaVA的開源多模態大型語言模型，專門用來解讀胸部X光影像並生成放射科報告。研究人員在包含374,881張標記影像的數據集上預訓練視覺變壓器，並結合大型語言模型進行微調，使用217,699份報告來提升生成準確性。CXR-LLaVA在內部測試中達到平均F1分數0.81，並在外部測試中為0.56，顯示出超越其他先進模型的潛力。該模型的報告準確率為72.7%，顯示出自動報告的可行性，並強調開源對進一步研究的重要性。 PubMed DOI

Radiology Report Annotation Using Generative Large Language Models: Comparative Analysis.
使用生成大型語言模型的放射學報告註釋：比較分析。 Int J Biomed Imaging 2025-02-19

最近大型語言模型（LLMs）如GPT-3.5和GPT-4在醫療領域的應用引起關注。本研究比較了這些模型在註解放射學報告及生成胸部CT印象的表現，旨在協助醫療專業人員處理日常文檔任務。研究使用了上下文學習和檢索增強生成等方法，並透過多種指標進行評估。結果顯示，GPT-4在性能上優於GPT-3.5，且提示設計對結果影響顯著。研究建議在醫療實踐中整合這些先進模型，以提升文檔效率與準確性。 PubMed DOI

Automated Radiology Report Labeling in Chest X-Ray Pathologies: Development and Evaluation of a Large Language Model Framework.
胸部 X 光病理的自動放射學報告標籤：大型語言模型框架的開發與評估。 JMIR Med Inform 2025-03-28

這項研究評估了一種基於GPT的大型語言模型（LLM）在標註非結構化放射學報告的效果，並與現有的CheXbert和CheXpert進行比較，使用了MIMIC-CXR這個大型胸部X光數據集。結果顯示，LLM的平均F1分數為0.9014，超過CheXpert（0.8864），接近CheXbert（0.9047）。在處理較長、複雜的病理描述時，LLM表現尤為優異。整體來看，LLM是傳統BERT方法的有力替代，提供更好的上下文理解，並減少對特徵工程的需求。 PubMed DOI

A clinically accessible small multimodal radiology model and evaluation metric for chest X-ray findings.
一個臨床可及的小型多模態放射學模型及胸部 X 光發現的評估指標。 Nat Commun 2025-04-01

大型基礎模型在生物醫學領域有潛力，但在臨床應用上面臨挑戰，如性能差距和高成本。本研究展示了一個開源的小型多模態模型，透過胸部X光影像生成診斷結果，解決放射學的問題。研究團隊訓練了697,000對影像-文本對，開發了專門的胸部X光編碼器，並與預訓練的語言模型整合。為了評估模型的準確性，團隊創建了CheXprompt，並用於基準測試，LLaVA-Rad模型表現優於一些大型模型。雖然尚未適合實時臨床使用，但這代表了在放射學中可臨床應用的進展。 PubMed DOI

Large Language Model with Region-guided Referring and Grounding for CT Report Generation.
區域引導參考與定位的大型語言模型在 CT 報告生成中的應用。 IEEE Trans Med Imaging 2025-04-11

Reg2RG框架針對CT報告生成的挑戰，專注於特定解剖區域，提升診斷性能。它利用通用分割模組的遮罩捕捉局部特徵，並引入局部特徵解耦（LFD）策略，以低計算成本保持高解析度。框架還實施區域報告對齊（RRA）訓練策略，透過識別參考區域來生成更具可解釋性的報告。大型語言模型（LLM）用作解碼器，從視覺特徵生成報告。實驗結果顯示，Reg2RG在自然語言生成和臨床效能上超越多種先進方法，且代碼已在GitHub公開。 PubMed DOI

原始文章

站上相關主題文章列表