The use of large language models in detecting Chinese ultrasound report errors.
大型語言模型在檢測中文超聲報告錯誤中的應用。 NPJ Digit Med 2025-01-28

這項回顧性研究探討大型語言模型（LLMs）在提升中文超音波報告準確性上的效果。研究分析了2024年1月至4月期間三家醫院的400份報告，發現243個錯誤，並將其分為六類。研究評估了三個版本的GPT和Claude 3.5 Sonnet在零樣本和少樣本情境下的表現。結果顯示，Claude 3.5 Sonnet在零樣本設定中的錯誤檢測率最高，達52.3%。此外，LLMs處理報告的速度也明顯快於放射科醫生，顯示其在提升報告準確性方面的潛力。 PubMed DOI

ECG-LM: Understanding Electrocardiogram with a Large Language Model.
ECG-LM：利用大型語言模型理解心電圖。 Health Data Sci 2025-02-05

心電圖（ECG）是監測心臟健康的重要工具，但解讀需要專業知識。近期，我們開發了ECG-Language Model（ECG-LM），這是首個能同時處理自然語言和ECG信號的多模態大型語言模型。透過生成文本-ECG配對數據集，ECG-LM在心血管疾病的診斷、節律和形態檢測上表現優於現有方法，顯示出其在疾病預測和問題回答中的潛力。這項技術有望提升臨床診斷的準確性與效率。 PubMed DOI

[Transformation of free-text radiology reports into structured data].
將自由文本放射學報告轉換為結構化數據。 Radiologie (Heidelb) 2025-02-11

將非結構化的放射科報告轉換為結構化數據，雖然大型語言模型（LLMs）展現出潛力，但面臨多項挑戰，如醫學術語的模糊性、縮寫的使用、報告表達的多樣性及數據質量不一等。為了克服這些問題，可以採用深度學習模型進行微調、結合規則系統、使用本體論等方法。此外，確保數據質量與可靠性也很重要，需透過穩健的評估指標、上下文整合、持續學習及人類監督來提升準確性。 PubMed DOI

Automated structured data extraction from intraoperative echocardiography reports using large language models.
使用大型語言模型自動化提取術中超聲心動圖報告的結構化數據。 Br J Anaesth 2025-03-04

這項研究探討了利用共識的大型語言模型（LLM）集成方法，從心臟超音波報告中提取結構化數據。分析了600份術中經食道超音波報告，重點在左心室射血分數、右心室收縮功能和三尖瓣返流。研究使用五個開源LLM，並創建四種投票策略的集成，評估其準確度和數據提取產量。結果顯示，全體一致的集成在共識準確度上表現最佳，但數據提取產量較低；相對多數的集成則在原始準確度和提取產量上表現較好，但共識準確度較低。整體而言，基於共識的LLM集成能有效提取心臟超音波報告中的數據。 PubMed DOI

Automated generation of echocardiography reports using artificial intelligence: a novel approach to streamlining cardiovascular diagnostics.
利用人工智慧自動生成心臟超音波報告：一種簡化心血管診斷的新方法。 Int J Cardiovasc Imaging 2025-03-30

這項研究評估了大型語言模型ChatGPT在生成心臟超音波報告及提供臨床建議的效果。研究分為虛構案例和臨床案例兩組，並將LLM的結果與經驗豐富的心臟科醫師進行比較。結果顯示，LLM的平均得分為6.86分，臨床案例的診斷準確性較高，且建議通常適當。LLM在85.7%的案例中生成可接受的報告，誤解率僅5.3%。整體而言，ChatGPT在臨床實踐中顯示出提升工作流程的潛力。 PubMed DOI

Performance of large language models for CAD-RADS 2.0 classification derived from cardiac CT reports.
大型語言模型在心臟CT報告中對CAD-RADS 2.0分類的表現。 J Cardiovasc Comput Tomogr 2025-04-10

這項研究評估大型語言模型（LLMs）自動生成CAD-RADS 2.0分數的能力，對於疾病描述和臨床決策非常重要。研究分析了200份心臟CT報告，使用了多種先進的LLMs，包括GPT-3.5、GPT-4o、Mistral 7b、Mixtral 8 × 7b和不同版本的Llama3。結果顯示，GPT-4o和Llama3 70b的準確率最高，分別為93%和92.5%。這些發現顯示，增強上下文學習的模型能有效生成CAD-RADS 2.0分數，提高心臟CT報告的效率與一致性，且開源模型在數據安全上也具優勢。 PubMed DOI

A comparative analysis of privacy-preserving large language models for automated echocardiography report analysis.
用於自動心臟超音波報告分析之隱私保護大型語言模型的比較分析 J Am Med Inform Assoc 2025-05-07

開源大型語言模型能準確擷取心臟超音波報告的重點資料，像是瓣膜疾病嚴重度和人工瓣膜有無，對建立大規模資料庫和疾病監控很有幫助。經過優化後，像Llama3.0-70B、Qwen2.0這些頂尖模型準確率超過98%，但處理速度較慢。小型模型判斷嚴重度較不準，但辨識人工瓣膜還不錯。主要錯誤來自分心或沒照指示。整體來說，LLMs自動化擷取資料很有潛力，但要兼顧準確和效率。 PubMed DOI

Evaluating large language models in echocardiography reporting: opportunities and challenges.
在心臟超音波報告中評估大型語言模型：機會與挑戰 Eur Heart J Digit Health 2025-05-21

研究團隊用開源大型語言模型微調，讓它們能自動整理心臟超音波報告。其中 EchoGPT（基於 Llama-2）表現最好，產出的總結精簡度幾乎和心臟科醫師寫的一樣好。這技術有望加快報告產出速度又不影響品質，但目前評估 AI 報告的方法還需要改進。 PubMed DOI

Leveraging large language models for accurate classification of liver lesions from MRI reports.
運用大型語言模型精確分類MRI報告中的肝臟病灶 Comput Struct Biotechnol J 2025-06-12

這項研究用88份真實MRI肝臟病灶報告，測試多款大型語言模型的分類能力。結果發現，Claude 3.5 Sonnet準確率最高，勝過GPT-4o等其他模型。雖然LLM有潛力協助醫療診斷，但臨床應用前還需更多驗證，嚴謹測試也很重要。 PubMed DOI

Data extraction from free-text stroke CT reports using GPT-4o and Llama-3.3-70B: the impact of annotation guidelines.
使用 GPT-4o 與 Llama-3.3-70B 從自由文本中風中風電腦斷層報告擷取資料：標註指引的影響 Eur Radiol Exp 2025-06-22

這項研究發現，給大型語言模型（如GPT-4o和Llama-3.3-70B）明確的標註指引，能大幅提升它們從中風CT報告擷取重點的準確度，其中GPT-4o表現最好。結果強調，清楚的指引對提升醫療自動化資料擷取很重要。 PubMed DOI

原始文章

站上相關主題文章列表