原始文章

這項研究探討如何利用自然語言處理(NLP)分析心臟超音波報告,目的是解決不同機構報告實踐的差異。研究人員測試了兩種NLP方法:EchoMap和使用GPT的零樣本推理。結果顯示,EchoMap在準確率上表現優異,第一層級達98%,而所有三個層級的準確率為79%。雖然GPT在第一層級的準確率相當,但EchoMap在第二和第三層級的表現更佳。這顯示統計機器學習技術在分析心臟超音波報告時的有效性。 PubMed DOI


站上相關主題文章列表

這項回顧性研究探討大型語言模型(LLMs)在提升中文超音波報告準確性上的效果。研究分析了2024年1月至4月期間三家醫院的400份報告,發現243個錯誤,並將其分為六類。研究評估了三個版本的GPT和Claude 3.5 Sonnet在零樣本和少樣本情境下的表現。結果顯示,Claude 3.5 Sonnet在零樣本設定中的錯誤檢測率最高,達52.3%。此外,LLMs處理報告的速度也明顯快於放射科醫生,顯示其在提升報告準確性方面的潛力。 PubMed DOI

心電圖(ECG)是監測心臟健康的重要工具,但解讀需要專業知識。近期,我們開發了ECG-Language Model(ECG-LM),這是首個能同時處理自然語言和ECG信號的多模態大型語言模型。透過生成文本-ECG配對數據集,ECG-LM在心血管疾病的診斷、節律和形態檢測上表現優於現有方法,顯示出其在疾病預測和問題回答中的潛力。這項技術有望提升臨床診斷的準確性與效率。 PubMed DOI

將非結構化的放射科報告轉換為結構化數據,雖然大型語言模型(LLMs)展現出潛力,但面臨多項挑戰,如醫學術語的模糊性、縮寫的使用、報告表達的多樣性及數據質量不一等。為了克服這些問題,可以採用深度學習模型進行微調、結合規則系統、使用本體論等方法。此外,確保數據質量與可靠性也很重要,需透過穩健的評估指標、上下文整合、持續學習及人類監督來提升準確性。 PubMed DOI

這項研究探討了利用共識的大型語言模型(LLM)集成方法,從心臟超音波報告中提取結構化數據。分析了600份術中經食道超音波報告,重點在左心室射血分數、右心室收縮功能和三尖瓣返流。研究使用五個開源LLM,並創建四種投票策略的集成,評估其準確度和數據提取產量。結果顯示,全體一致的集成在共識準確度上表現最佳,但數據提取產量較低;相對多數的集成則在原始準確度和提取產量上表現較好,但共識準確度較低。整體而言,基於共識的LLM集成能有效提取心臟超音波報告中的數據。 PubMed DOI

這項研究評估了大型語言模型ChatGPT在生成心臟超音波報告及提供臨床建議的效果。研究分為虛構案例和臨床案例兩組,並將LLM的結果與經驗豐富的心臟科醫師進行比較。結果顯示,LLM的平均得分為6.86分,臨床案例的診斷準確性較高,且建議通常適當。LLM在85.7%的案例中生成可接受的報告,誤解率僅5.3%。整體而言,ChatGPT在臨床實踐中顯示出提升工作流程的潛力。 PubMed DOI

這項研究評估大型語言模型(LLMs)自動生成CAD-RADS 2.0分數的能力,對於疾病描述和臨床決策非常重要。研究分析了200份心臟CT報告,使用了多種先進的LLMs,包括GPT-3.5、GPT-4o、Mistral 7b、Mixtral 8 × 7b和不同版本的Llama3。結果顯示,GPT-4o和Llama3 70b的準確率最高,分別為93%和92.5%。這些發現顯示,增強上下文學習的模型能有效生成CAD-RADS 2.0分數,提高心臟CT報告的效率與一致性,且開源模型在數據安全上也具優勢。 PubMed DOI

開源大型語言模型能準確擷取心臟超音波報告的重點資料,像是瓣膜疾病嚴重度和人工瓣膜有無,對建立大規模資料庫和疾病監控很有幫助。經過優化後,像Llama3.0-70B、Qwen2.0這些頂尖模型準確率超過98%,但處理速度較慢。小型模型判斷嚴重度較不準,但辨識人工瓣膜還不錯。主要錯誤來自分心或沒照指示。整體來說,LLMs自動化擷取資料很有潛力,但要兼顧準確和效率。 PubMed DOI

研究團隊用開源大型語言模型微調,讓它們能自動整理心臟超音波報告。其中 EchoGPT(基於 Llama-2)表現最好,產出的總結精簡度幾乎和心臟科醫師寫的一樣好。這技術有望加快報告產出速度又不影響品質,但目前評估 AI 報告的方法還需要改進。 PubMed DOI

這項研究用88份真實MRI肝臟病灶報告,測試多款大型語言模型的分類能力。結果發現,Claude 3.5 Sonnet準確率最高,勝過GPT-4o等其他模型。雖然LLM有潛力協助醫療診斷,但臨床應用前還需更多驗證,嚴謹測試也很重要。 PubMed DOI

這項研究發現,給大型語言模型(如GPT-4o和Llama-3.3-70B)明確的標註指引,能大幅提升它們從中風CT報告擷取重點的準確度,其中GPT-4o表現最好。結果強調,清楚的指引對提升醫療自動化資料擷取很重要。 PubMed DOI