原始文章

在胸部X光片的分析中,傳統的標註系統多半只能提供簡單的存在與否標籤,缺乏靈活性。為了解決這個問題,我們推出了MAPLEZ,這是一種利用大型語言模型的創新方法,能從CXR報告中提取更詳細的資訊,包括發現的位置、嚴重程度及醫生的不確定性。研究顯示,MAPLEZ在標註質量上有顯著提升,宏觀F1分數提高3.6%,位置標註更是提升超過20%。此外,結合這些標註後,分類性能也有明顯改善。我們還提供了代碼和標註的訪問權限。 PubMed DOI


站上相關主題文章列表

研究利用大型語言模型協助臨床醫生問心臟超聲心動圖報告,提升對複雜心臟病患見解,增進患者護理效率。研究收集西奈山醫療體系10年數據,每患者有10份報告。LLM模型LLaMA-2 70B回答問題準確率達90%,尤其在嚴重程度評估和診斷檢索表現較佳。研究顯示使用LLM解釋心臟超聲心動圖數據有效,比傳統搜索更佳,提高臨床決策和研究效率。 PubMed DOI

新方法MAPLEZ利用大型語言模型從胸部X光報告中提取詳細的發現標籤,包含存在、位置、嚴重程度和不確定性等資訊。相較現有方法,MAPLEZ表現更佳,提升模型品質。研究人員提供代碼和標籤以供進一步研究。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在冠狀動脈疾病(CAD)診斷中的表現,特別是根據CAD-RADS 2.0指引進行比較。結果顯示,ChatGPT 4o的準確率最高,達到100%,接著是ChatGPT 4和Claude 3 Opus,準確率為96.6%。其他模型的準確率也不錯,介於90%到93.3%之間。這些結果顯示LLMs在改善CAD的放射報告和病人照護方面的潛力,並強調進一步研究其視覺診斷能力的重要性。 PubMed DOI

這項研究評估大型語言模型(LLMs)在解釋乳腺影像報告及提供臨床建議的表現,分為兩個步驟: 1. **文本評估**:比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳(90%),超過一般放射科醫師(78%)和乳腺放射科醫師(82%)。 2. **視覺評估**:測試五個多模態LLMs在100張乳腺超音波影像上的表現,Claude 3.5 Sonnet以59%準確率領先。 研究顯示,雖然LLMs在文本評估中表現良好,但視覺診斷能力有限,需在放射科醫師監督下使用,以避免誤診。 PubMed DOI

這項研究提出了一種新方法,結合大型語言模型(LLMs)與電腦輔助診斷(CAD)網絡,提升胸部X光片的醫學影像分析。雖然LLMs在自然語言處理上表現優異,但在醫學影像上通常不佳。這個框架利用LLMs的優勢,改善CAD系統的診斷準確性和報告生成,讓報告品質更高。使用ChatGPT後,診斷表現提升了16.42個百分點,GPT-3則在F1-score上提高了15.00個百分點。這種創新方法有潛力改變臨床決策過程,並改善病患互動。 PubMed DOI

這項研究旨在提升一個開源的大型語言模型(LLM),自動生成來自不同醫院的放射學報告印象,涵蓋CT、超音波和MRI等影像檢查。研究人員使用UCSF醫療中心和Zuckerberg舊金山總醫院的大數據集,透過ROUGE分數評估模型表現。結果顯示,該LLM與專科醫師撰寫的印象有顯著重疊,雖然外部驗證時表現稍降。針對CT胸部檢查的讀者研究顯示,模型生成的印象在臨床和語法準確性上表現良好,顯示其在輔助放射科醫師工作中的潛力。 PubMed DOI

放射學中的結構化報告在可比性、可讀性和細節上有明顯優勢,但其採用仍然有限。本研究探討了一種本地托管的語言模型,能將自由文本的放射報告轉換為結構化數據,且不影響放射科醫師的工作流程。研究結果顯示,該模型生成的結構化報告在英語和德語的準確性接近人類讀者,顯示出良好的性能。結論指出,為了提高結構化報告的採用,需加強自動化系統與臨床流程的整合,讓醫師能在報告過程中受益於結構化數據。 PubMed DOI

隨著心血管疾病、腫瘤等慢性病的增加,研究人員開始探索生成醫療報告的新方法。近期的研究聚焦於利用大型跨模態模型和自然語言生成技術,來縮短視覺數據(如X光影像)與文本之間的差距。為了解決這些挑戰,我們提出了多焦點區域輔助報告生成網絡(MRARGN),結合ResNet-50模型及注意力機制,提升跨模態信息的匹配,並生成詳細的醫學文本描述。實驗結果顯示,MRARGN在醫療報告生成上表現優於多種現有方法,證明其有效性。 PubMed DOI

這項研究比較了OpenAI的GPT-4與幾個開源大型語言模型在從胸部X光報告中提取相關發現的表現。使用了來自ImaGenome和麻省總醫院的數據集。結果顯示,Llama 2-70B在ImaGenome數據集的微F1分數為0.97,而GPT-4為0.98。在機構數據集中,GPT-4的表現也優於其他模型。研究強調了少樣本提示能提升開源模型在醫療報告標註中的潛力。 PubMed DOI

這項研究分析了不同的自然語言處理(NLP)模型和大型語言模型(LLM)在放射科報告中匿名化個人健康資訊(PHI)的效果,並遵循HIPAA法規。研究發現,兩個NLP模型成功移除了所有日期、醫療紀錄號碼和檢查號碼,而LLM在日期的移除效果較差。針對準確性優化的NLP模型表現最佳,達到完美的F1分數。研究結論指出,預訓練的NLP模型在不影響臨床數據的情況下,更有效地進行匿名化,LLM則可能意外刪除重要資訊,強調了可靠的PHI匿名化對醫療應用的重要性。 PubMed DOI