Automated classification of brain MRI reports using fine-tuned large language models.
使用微調的大型語言模型自動分類腦部 MRI 報告。 Neuroradiology 2024-07-12

研究測試了精細調校的大型語言模型（LLM）在分類腦部磁振造影報告的效能。LLM表現高準確、敏感，且處理速度快，比人類放射科醫師更有效。結果顯示LLM在醫學影像分析上有潛力，與專業醫師相當。 PubMed DOI

Evaluating Large Language Model (LLM) Performance on Established Breast Classification Systems.
評估大型語言模型 (LLM) 在既定乳腺分類系統上的表現。 Diagnostics (Basel) 2024-07-27

醫學研究人員越來越多地使用先進的語言模型（LLMs），如ChatGPT-4和Gemini，來改善乳腺相關疾病的診斷。本研究評估這些模型在複雜醫學分類系統中的應用能力，以協助整形外科醫生做出更好的診斷和治療決策。研究中創建了五十個臨床情境來評估分類準確性，結果顯示Gemini的準確率高達98%，而ChatGPT-4為71%。Gemini在多個分類系統中表現優於ChatGPT-4，顯示出其在整形外科實踐中的潛力，未來有望增強診斷支持和決策能力。 PubMed DOI

[Transformation of free-text radiology reports into structured data].
將自由文本放射學報告轉換為結構化數據。 Radiologie (Heidelb) 2025-02-11

將非結構化的放射科報告轉換為結構化數據，雖然大型語言模型（LLMs）展現出潛力，但面臨多項挑戰，如醫學術語的模糊性、縮寫的使用、報告表達的多樣性及數據質量不一等。為了克服這些問題，可以採用深度學習模型進行微調、結合規則系統、使用本體論等方法。此外，確保數據質量與可靠性也很重要，需透過穩健的評估指標、上下文整合、持續學習及人類監督來提升準確性。 PubMed DOI

A preliminary investigation into the potential, pitfalls, and limitations of large language models for mammography interpretation.
大型語言模型在乳房X光檢查解讀中的潛力、陷阱與限制的初步研究。 Discov Oncol 2025-02-24

這項研究評估了GPT-4在解讀乳房X光影像的表現，使用了120張影像，分為有發現和無發現兩類。GPT-4的正確識別率為53.3%，在微鈣化和腫塊的識別上，敏感度為50.0%，特異度為37.5%。研究顯示出許多假陽性和假陰性，並出現幻覺現象，顯示模型的局限性。這強調了在乳房X光檢查中使用大型語言模型的潛力與風險，呼籲對醫療AI工具進行專門訓練和驗證，以確保其臨床可靠性與安全性。 PubMed DOI

Transforming breast cancer diagnosis and treatment with large language Models: A comprehensive survey.
以大型語言模型轉變乳腺癌診斷與治療：一項綜合調查。 Methods 2025-04-08

乳腺癌是女性常見的癌症，早期準確診斷對提高存活率至關重要，但現有影像學方法常無法達到預期效果。大型語言模型（LLMs）利用先進技術，能分析大量醫療數據，幫助早期診斷並提供個性化治療策略。不過，LLMs在乳腺癌管理中仍面臨數據敏感性、算法透明度及倫理等挑戰。研究顯示，LLMs能顯著提升診斷效率、臨床信任度及患者教育質量，顯示其在乳腺癌精準醫療中的潛力。 PubMed DOI

Enhancing radiomics features via a large language model for classifying benign and malignant breast tumors in mammography.
透過大型語言模型增強放射組學特徵，以分類乳腺X光檢查中的良性和惡性乳腺腫瘤。 Comput Methods Programs Biomed 2025-04-09

放射組學在臨床決策中越來越重要，尤其是乳腺腫瘤的診斷與治療。近期大型語言模型（LLMs）的進展有助於提升放射組學的分析。本研究透過整合LLM的臨床知識，改善乳腺攝影中良性與惡性腫瘤的分類。我們提取了放射組學特徵，並利用提示工程創建輸入序列，經過微調的LLaMA模型處理後，於VinDr-Mammo和INbreast數據集上表現優於傳統方法，準確率分別達到0.671和0.839。這顯示LLMs在放射組學中的潛力，特別是在乳腺攝影分析上。 PubMed DOI

Performance of large language models for CAD-RADS 2.0 classification derived from cardiac CT reports.
大型語言模型在心臟CT報告中對CAD-RADS 2.0分類的表現。 J Cardiovasc Comput Tomogr 2025-04-10

這項研究評估大型語言模型（LLMs）自動生成CAD-RADS 2.0分數的能力，對於疾病描述和臨床決策非常重要。研究分析了200份心臟CT報告，使用了多種先進的LLMs，包括GPT-3.5、GPT-4o、Mistral 7b、Mixtral 8 × 7b和不同版本的Llama3。結果顯示，GPT-4o和Llama3 70b的準確率最高，分別為93%和92.5%。這些發現顯示，增強上下文學習的模型能有效生成CAD-RADS 2.0分數，提高心臟CT報告的效率與一致性，且開源模型在數據安全上也具優勢。 PubMed DOI

Large Language Models in Breast Cancer Reconstruction: A Framework for Patient-Specific Recovery and Predictive Insights.
乳腺癌重建中的大型語言模型：患者特定恢復和預測洞察的框架。 SLAS Technol 2025-04-11

乳癌重建在癌症治療中扮演重要角色，通常與手術同時進行以促進病人恢復。本研究提出一個新框架，利用自然語言處理（NLP）和大型語言模型（LLMs），增強病人的恢復預測。透過BioBERT進行數據處理，並使用ChatGPT-4和Gemini提供個性化的重建成功率和併發症見解。研究顯示，這些模型的準確率高達98.4%和98.7%，並能有效預測術後情況，提升病人生活品質。這項技術結合了計算與生命科學，為臨床醫生提供強大工具。 PubMed DOI

The Role of Large Language Models (LLMs) in Breast Imaging Today and in the Near Future.
大型語言模型（LLMs）在乳房影像學現今及近期未來的角色 J Magn Reson Imaging 2025-05-05

大型語言模型像GPT-4和Gemini在乳房影像領域很有潛力，可協助報告撰寫、診斷標準化和整合臨床指引。未來多模態能力也有望提升腫瘤分類等表現。不過，目前仍有幻覺、偏見、知識落差和隱私等挑戰。現階段LLMs只能當輔助工具，無法取代醫師，導入臨床還需嚴謹訓練和監督。 PubMed DOI

Using a Large Language Model for Breast Imaging Reporting and Data System Classification and Malignancy Prediction to Enhance Breast Ultrasound Diagnosis: Retrospective Study.
運用大型語言模型於乳房影像報告與資料系統（BI-RADS）分級及惡性預測以提升乳房超音波診斷：回溯性研究 JMIR Med Inform 2025-06-11

這項回溯性研究發現，ChatGPT-4在解讀乳房超音波報告並用BI-RADS分類結節時，表現比資淺放射科醫師更好，和資深醫師差不多。它預測惡性腫瘤的準確度高（AUC 0.82，準確率80.63%，敏感度90.56%，特異度73.51%）。若把ChatGPT-4納入影像判讀流程，能進一步提升醫師診斷準確率，減少不同醫師間的判讀差異。 PubMed DOI

原始文章

站上相關主題文章列表