Privacy-ensuring Open-weights Large Language Models Are Competitive with Closed-weights GPT-4o in Extracting Chest Radiography Findings from Free-Text Reports.
保障隱私的開放權重大型語言模型在從自由文本報告中提取胸部放射影像發現方面與封閉權重的 GPT-4o 具競爭力。 Radiology 2025-01-14

這項研究探討了開放權重的大型語言模型（LLMs）在從放射科報告中提取結構化內容的效果，並與傳統的規則系統及封閉權重模型（如GPT-4）進行比較。研究結果顯示，GPT-4o在英語報告中表現最佳，F1分數達92.4%，而Mistral-Large在德語數據集中也表現優異。當使用1000份報告進行微調時，開放權重LLMs的表現顯著超過BERT。結論指出，開放權重模型在結構化報告數據方面具有效能，特別是在中等數據量微調時。 PubMed DOI

Fine-tuning a local LLaMA-3 large language model for automated privacy-preserving physician letter generation in radiation oncology.
在放射腫瘤學中微調本地 LLaMA-3 大型語言模型以自動生成保護隱私的醫生信函。 Front Artif Intell 2025-01-29

這項研究探討大型語言模型（LLMs），特別是LLaMA模型在放射腫瘤學中生成醫師信件的應用，重點在隱私與效率。研究發現，未經微調的LLaMA模型效果不佳，但QLoRA演算法能在有限資源下進行有效微調，使模型學習相關資訊並生成符合機構風格的信件。結果顯示，8B LLaMA-3模型在生成摘要報告上表現優於13B LLaMA-2模型。醫師評估認為，微調後的模型能有效生成信件的基本內容，並在適當審查下具實際臨床價值。 PubMed DOI

Benchmarking the diagnostic performance of open source LLMs in 1933 Eurorad case reports.
1933年Eurorad病例報告中開源LLMs診斷性能的基準評估。 NPJ Digit Med 2025-02-11

最近大型語言模型（LLMs）在放射診斷方面的進展顯著，無論是開源還是專有模型，都能透過本地或雲端部署來解決隱私問題。研究評估了十五個開源LLMs和一個封閉源LLM（GPT-4o）的診斷表現，使用了1,933個來自Eurorad的案例。結果顯示，GPT-4o的表現最佳，其次是Llama-3-70B，顯示開源模型的表現逐漸接近專有模型，顯示其在放射鑑別診斷中的潛力。 PubMed DOI

Radiology Report Annotation Using Generative Large Language Models: Comparative Analysis.
使用生成大型語言模型的放射學報告註釋：比較分析。 Int J Biomed Imaging 2025-02-19

最近大型語言模型（LLMs）如GPT-3.5和GPT-4在醫療領域的應用引起關注。本研究比較了這些模型在註解放射學報告及生成胸部CT印象的表現，旨在協助醫療專業人員處理日常文檔任務。研究使用了上下文學習和檢索增強生成等方法，並透過多種指標進行評估。結果顯示，GPT-4在性能上優於GPT-3.5，且提示設計對結果影響顯著。研究建議在醫療實踐中整合這些先進模型，以提升文檔效率與準確性。 PubMed DOI

Large language models for error detection in radiology reports: a comparative analysis between closed-source and privacy-compliant open-source models.
大型語言模型在放射科報告中的錯誤檢測：封閉源與符合隱私的開源模型之間的比較分析。 Eur Radiol 2025-02-20

這項研究探討了符合隱私要求的開源大型語言模型（LLMs）在檢測放射科報告錯誤的有效性，並與商業封閉源模型比較。分析了120份報告，發現封閉源模型（如GPT-4）在錯誤檢測率上優於開源模型，分別為88%和79%。不過，開源模型的處理時間較短，每份報告僅需6秒。研究結論指出，開源模型雖然有效，但準確性尚未達到封閉源模型的水準，未來有潛力在保護病人隱私的同時提升臨床工作流程。 PubMed DOI

[Integration of large language models into the clinic : Revolution in analysing and processing patient data to increase efficiency and quality in radiology].
大型語言模型在臨床中的整合：革命性地分析和處理患者數據，以提高放射學的效率和質量。 Radiologie (Heidelb) 2025-03-12

大型語言模型（LLMs）如ChatGPT、Llama和Claude，正在改變醫療保健，特別是在放射科。最近，弗賴堡和巴塞爾大學醫院的研究顯示，這些系統能有效整合影像存檔與傳輸系統（PACS）和電子健康紀錄（EHR），提升醫師效率，縮短報告時間，並自動化例行任務。研究結果顯示，LLMs不僅提高了診斷質量，還促進了跨學科合作。未來應著重增強透明度和擴大應用範圍，確保遵守倫理和法律標準。 PubMed DOI

Performance of large language models for CAD-RADS 2.0 classification derived from cardiac CT reports.
大型語言模型在心臟CT報告中對CAD-RADS 2.0分類的表現。 J Cardiovasc Comput Tomogr 2025-04-10

這項研究評估大型語言模型（LLMs）自動生成CAD-RADS 2.0分數的能力，對於疾病描述和臨床決策非常重要。研究分析了200份心臟CT報告，使用了多種先進的LLMs，包括GPT-3.5、GPT-4o、Mistral 7b、Mixtral 8 × 7b和不同版本的Llama3。結果顯示，GPT-4o和Llama3 70b的準確率最高，分別為93%和92.5%。這些發現顯示，增強上下文學習的模型能有效生成CAD-RADS 2.0分數，提高心臟CT報告的效率與一致性，且開源模型在數據安全上也具優勢。 PubMed DOI

Improving Radiology Report Conciseness and Structure via Local Large Language Models.
利用在地大型語言模型提升放射科報告的簡潔性與結構性 J Imaging Inform Med 2025-04-21

這項研究用私有大型語言模型在本地處理814份放射科報告，成功把內容重組、精簡，並依器官系統分類。Mixtral LLM表現最好，能減少超過53%冗詞，提升報告清晰度和結構。結果證明開源LLM不僅保障資料安全，也能有效簡化報告流程，幫助醫師更快掌握重點，優化臨床工作。 PubMed DOI

A comparative analysis of privacy-preserving large language models for automated echocardiography report analysis.
用於自動心臟超音波報告分析之隱私保護大型語言模型的比較分析 J Am Med Inform Assoc 2025-05-07

開源大型語言模型能準確擷取心臟超音波報告的重點資料，像是瓣膜疾病嚴重度和人工瓣膜有無，對建立大規模資料庫和疾病監控很有幫助。經過優化後，像Llama3.0-70B、Qwen2.0這些頂尖模型準確率超過98%，但處理速度較慢。小型模型判斷嚴重度較不準，但辨識人工瓣膜還不錯。主要錯誤來自分心或沒照指示。整體來說，LLMs自動化擷取資料很有潛力，但要兼顧準確和效率。 PubMed DOI

Large Language Models for Diagnosing Focal Liver Lesions From CT/MRI Reports: A Comparative Study With Radiologists.
利用大型語言模型從CT/MRI報告診斷肝臟局灶性病變：與放射科醫師的比較研究 Liver Int 2025-05-10

這項研究發現，ChatGPT-4o在診斷肝臟局部病灶時，表現大致和資淺放射科醫師差不多，但還是比不上有經驗的醫師。把ChatGPT-4o加入診斷流程，也沒明顯提升醫師的診斷表現。總結來說，目前大型語言模型對診斷這類疾病的幫助有限，準確度還有待加強。 PubMed DOI

原始文章

站上相關主題文章列表