原始文章

這項研究探討如何利用自然語言處理(NLP)分析心臟超音波報告,目的是解決不同機構報告實踐的差異。研究人員測試了兩種NLP方法:EchoMap和使用GPT的零樣本推理。結果顯示,EchoMap在準確率上表現優異,第一層級達98%,而所有三個層級的準確率為79%。雖然GPT在第一層級的準確率相當,但EchoMap在第二和第三層級的表現更佳。這顯示統計機器學習技術在分析心臟超音波報告時的有效性。 PubMed DOI


站上相關主題文章列表

研究利用大型語言模型協助臨床醫生問心臟超聲心動圖報告,提升對複雜心臟病患見解,增進患者護理效率。研究收集西奈山醫療體系10年數據,每患者有10份報告。LLM模型LLaMA-2 70B回答問題準確率達90%,尤其在嚴重程度評估和診斷檢索表現較佳。研究顯示使用LLM解釋心臟超聲心動圖數據有效,比傳統搜索更佳,提高臨床決策和研究效率。 PubMed DOI

研究比較了GPT-4與傳統監督式模型在臨床註記中提取資訊的表現,結果顯示GPT-4在乳癌病理報告分類上表現優異,甚至超越其他LLMs和監督式模型。GPT-4的零-shot分類能力對標籤不平衡的任務特別有效。雖然LLMs減少了標註需求,但簡單模型配合大量標註資料也能達到相當效果。GPT-4有潛力加速臨床自然語言處理研究,減少標註需求,促進臨床研究中使用自然語言處理變數。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是Open AI的GPT-4.0和Microsoft Bing的GPT-4,在將非結構化的乳房超音波報告轉換為結構化格式的有效性。研究分析了100份報告,結果顯示GPT-4.0在生成結構化報告、準確分配BI-RADS分類及提供管理建議方面均優於Bing。此外,GPT-4.0在預測良性和惡性特徵的能力也較佳,但仍不及資深放射科醫師。這顯示GPT-4.0在醫療報告處理上具有潛力。 PubMed DOI

您的研究顯示開源大型語言模型(LLMs)在醫療領域的潛力,特別是在德文臨床文本中提取心血管功能指標。透過分析497份心臟MRI報告,您成功提取14個指標,並達到95.4%的正確標註率和99.8%的命名實體識別準確率,顯示這些模型能有效處理醫療語言的複雜性。這項研究強調了開源LLMs在臨床環境中的應用潛力,並為未來在其他語言的醫療研究鋪路。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在冠狀動脈疾病(CAD)診斷中的表現,特別是根據CAD-RADS 2.0指引進行比較。結果顯示,ChatGPT 4o的準確率最高,達到100%,接著是ChatGPT 4和Claude 3 Opus,準確率為96.6%。其他模型的準確率也不錯,介於90%到93.3%之間。這些結果顯示LLMs在改善CAD的放射報告和病人照護方面的潛力,並強調進一步研究其視覺診斷能力的重要性。 PubMed DOI

這項研究針對從非結構化的心血管診斷報告中提取數據的挑戰,特別是經胸心臟超音波檢查(TTE)報告。研究人員開發了一個兩步驟的過程,利用Llama2 70b和Llama2 13b模型。首先,Llama2 70b根據3,000份報告生成各種格式的TTE報告;接著,Llama2 13b(HeartDx-LM)微調這些報告以提取臨床數據。結果顯示,HeartDx-LM在多個數據集上表現優異,成功自動化將非結構化報告轉為結構化數據,提升心血管護理並促進研究,並已公開供使用。 PubMed DOI

這項回顧性研究探討大型語言模型(LLMs)在提升中文超音波報告準確性上的效果。研究分析了2024年1月至4月期間三家醫院的400份報告,發現243個錯誤,並將其分為六類。研究評估了三個版本的GPT和Claude 3.5 Sonnet在零樣本和少樣本情境下的表現。結果顯示,Claude 3.5 Sonnet在零樣本設定中的錯誤檢測率最高,達52.3%。此外,LLMs處理報告的速度也明顯快於放射科醫生,顯示其在提升報告準確性方面的潛力。 PubMed DOI

心電圖(ECG)是監測心臟健康的重要工具,但解讀需要專業知識。近期,我們開發了ECG-Language Model(ECG-LM),這是首個能同時處理自然語言和ECG信號的多模態大型語言模型。透過生成文本-ECG配對數據集,ECG-LM在心血管疾病的診斷、節律和形態檢測上表現優於現有方法,顯示出其在疾病預測和問題回答中的潛力。這項技術有望提升臨床診斷的準確性與效率。 PubMed DOI

這項研究探討了利用共識的大型語言模型(LLM)集成方法,從心臟超音波報告中提取結構化數據。分析了600份術中經食道超音波報告,重點在左心室射血分數、右心室收縮功能和三尖瓣返流。研究使用五個開源LLM,並創建四種投票策略的集成,評估其準確度和數據提取產量。結果顯示,全體一致的集成在共識準確度上表現最佳,但數據提取產量較低;相對多數的集成則在原始準確度和提取產量上表現較好,但共識準確度較低。整體而言,基於共識的LLM集成能有效提取心臟超音波報告中的數據。 PubMed DOI

這項研究評估了大型語言模型ChatGPT在生成心臟超音波報告及提供臨床建議的效果。研究分為虛構案例和臨床案例兩組,並將LLM的結果與經驗豐富的心臟科醫師進行比較。結果顯示,LLM的平均得分為6.86分,臨床案例的診斷準確性較高,且建議通常適當。LLM在85.7%的案例中生成可接受的報告,誤解率僅5.3%。整體而言,ChatGPT在臨床實踐中顯示出提升工作流程的潛力。 PubMed DOI