原始文章

這篇論文提出「Noisy Report Refinement(NRR)」新任務,專注於把雜亂的線上文本轉換成乾淨的放射科報告。作者用大型語言模型結合自我批判和選擇策略來提升報告品質,並推出專屬的新基準NRRBench。實驗證明,他們的方法在報告的乾淨度、實用性和正確性上都比現有方法更好。 PubMed DOI


站上相關主題文章列表

人工智慧在放射學報告生成方面有進步,但評估AI報告仍有挑戰。結合放射科醫師專業知識與GPT-3.5、GPT-4等大型語言模型,使用ICIL和CoT推理對齊評估標準。透過回歸模型聚合分數進行比較,實驗結果顯示此方法優於現有指標。穩健性已驗證,將釋出專家註釋以增進AI醫學報告評估品質。 PubMed DOI

隨著患者能更直接獲取醫療紀錄,放射科報告中的醫學術語卻常讓人困惑。為了解決這個問題,我們提出利用大型語言模型(LLM)自動生成更易懂的報告翻譯。我們在100份去識別化的神經放射科報告上進行測試,並在不同閱讀水平上生成翻譯。結果顯示,翻譯的準確率和可讀性均優於傳統方法,特別是在第八年級閱讀水平上,準確率分別達到88%和93%。這種方法不僅增強了患者的理解,也不會顯著增加醫生的工作負擔。 PubMed DOI

放射學中的結構化報告在可比性、可讀性和細節上有明顯優勢,但其採用仍然有限。本研究探討了一種本地托管的語言模型,能將自由文本的放射報告轉換為結構化數據,且不影響放射科醫師的工作流程。研究結果顯示,該模型生成的結構化報告在英語和德語的準確性接近人類讀者,顯示出良好的性能。結論指出,為了提高結構化報告的採用,需加強自動化系統與臨床流程的整合,讓醫師能在報告過程中受益於結構化數據。 PubMed DOI

在放射學中,人工智慧(AI)已改善報告生成,但評估這些報告仍具挑戰。傳統評估指標常無法捕捉臨床細微語義,或過於專注細節,影響報告清晰度。為解決此問題,我們結合放射科醫師專業知識與大型語言模型(如GPT-3.5和GPT-4),採用上下文指導學習和思維鏈推理,促進AI與人類報告的比較。實驗顯示,我們的方法在評估準確性上顯著優於現有指標,並計劃公開放射科專家註解,為未來評估建立新基準。 PubMed DOI

醫學影像分析需要放射科醫師的專業知識,但手動報告過程耗時且成本高。為了解決這些問題,研究者提出了多種方法,包括深度學習技術,來協助醫師。系統性文獻回顧顯示,編碼器-解碼器框架是最常用的模型,準確率達92-95%。雖然這些方法展現良好效果,但仍面臨過擬合和數據依賴等挑戰。本文提供了克服這些問題的建議,旨在提升醫學報告生成的準確性與效率,減輕醫師的工作負擔。 PubMed DOI

將非結構化的放射科報告轉換為結構化數據,雖然大型語言模型(LLMs)展現出潛力,但面臨多項挑戰,如醫學術語的模糊性、縮寫的使用、報告表達的多樣性及數據質量不一等。為了克服這些問題,可以採用深度學習模型進行微調、結合規則系統、使用本體論等方法。此外,確保數據質量與可靠性也很重要,需透過穩健的評估指標、上下文整合、持續學習及人類監督來提升準確性。 PubMed DOI

研究團隊開發了一套新方法,訓練出比傳統關鍵字或現有語意模型更準確的放射科報告搜尋系統 RadSearch。這系統在臨床應用上表現更好,結合大型語言模型後,診斷也更精確,有助提升臨床效率和報告搜尋的實用性。 PubMed DOI

這項研究用私有大型語言模型在本地處理814份放射科報告,成功把內容重組、精簡,並依器官系統分類。Mixtral LLM表現最好,能減少超過53%冗詞,提升報告清晰度和結構。結果證明開源LLM不僅保障資料安全,也能有效簡化報告流程,幫助醫師更快掌握重點,優化臨床工作。 PubMed DOI

這項研究比較多種大型語言模型在偵測胸腔放射科報告錯誤的表現,發現經過微調的 Llama-3-70B-Instruct 模型最準確,F1 分數約 0.75–0.83。實測也證實,這模型能有效協助醫師找出報告錯誤,顯示微調後的生成式語言模型有助提升放射科報告校對效率與準確度。 PubMed DOI

這篇論文提出一種多階段訓練法,先用疾病標籤、再用實體關係、最後才用完整報告來訓練大型語言模型,逐步增加難度。這樣能讓模型更專注臨床重點,生成的放射科報告在語言流暢度和臨床準確性都表現最佳。程式碼已開源於 GitHub。 PubMed DOI