原始文章

這項研究探討如何從非結構化的病理報告中提取結構化資訊,儘管已有標準。作者提出一個實用框架,利用大型多模態模型和上下文感知的提示策略,提取如分級和大小等特定欄位。每個欄位都有信心值,顯示提取準確性。評估結果顯示準確率高達0.99,信心分數有效指標,並能自動檢測錯誤。提取的信息對預後目的高度相關。該框架的演示和結直腸癌數據已在線上提供,供進一步探索與應用。 PubMed DOI


站上相關主題文章列表

癌症研究中,病理報告是重要資料,但常被忽略。缺乏公開資料集來測試基於報告的模型。利用OCR和NLP技術處理病理報告,建立9523份報告的機器可讀語料庫。在32種組織的癌症類型分類上取得高準確度。這資料集對各領域研究有幫助。 PubMed DOI

研究比較了不同NLP模型在擷取非小細胞肺癌患者影像報告中的癌症結果。結果顯示,DFCI-ImagingBERT表現最佳,但簡單模型也不錯。若資源有限,簡單機器學習模型仍可有效。 PubMed DOI

病理報告在癌症研究中很重要,但常被忽略。最近OCR和NLP技術進步,可從報告中提取資訊。透過這些技術,從9523份報告建立新數據集,可準確分類32種組織的癌症類型。對臨床NLP、臨床試驗和臨床醫師都有幫助。 PubMed DOI

醫療機構的病理科常有重要資料,但提取資料常需手動且耗時。利用大型語言模型如ChatGPT和Google Bard能自動化這過程。將病理報告輸入模型,可輕鬆創建摘要報告,並匯出至Excel等工具。AI輔助的資料提取可提升研究效率和準確性,勝過手動方式。 PubMed DOI

研究利用大型語言模型和資訊提取系統辨識放射學報告中轉移部位,最佳模型F1分數為0.91,資訊提取系統更高達0.93。系統在不同癌症和驗證集有高準確性,發現第四期結腸癌和肺癌患者轉移模式不同。這有助於癌症研究和臨床試驗。 PubMed DOI

這篇論文探討流行病學和臨床癌症登記在改善腫瘤醫療及研究中的重要性,特別是在癌症影響日益擴大的情況下。文中指出醫療數據的多樣性帶來挑戰,使得腫瘤手動記錄變得困難。研究提出利用大型語言模型(LLMs)將非結構化醫療報告轉換為德國基本腫瘤數據集所需的結構化格式。結果顯示,將LLMs整合進醫院數據管理或癌症登記系統,能顯著提升癌症數據的質量與完整性,對於有效的診斷、治療及療效評估至關重要。這項研究為人工智慧在醫療數據處理及癌症護理中的潛力提供了新的見解。 PubMed DOI

這項研究探討小型大型語言模型(sLLM)在從病理報告中提取關鍵資訊的效果。使用三個版本的Llama 2模型,參數從70億到700億不等,並在零樣本和五樣本學習情境下進行評估。結果顯示,700億參數的模型在五樣本情境下表現優異,顯示sLLM能有效提升數據提取的效率與準確性。研究強調範例學習的重要性,並討論模型大小、準確性及處理時間的權衡,支持在臨床環境中應用先進語言模型,以改善病人護理和生物醫學研究。 PubMed DOI

這項研究探討如何利用自然語言處理(NLP)和生成語言模型(GLMs)從肺癌患者的病理報告中提取關鍵資訊。研究目的是評估這些模型在提取病理階段數據的有效性,並考慮在資源有限的情況下使用較小型GLMs的可行性。研究團隊從首爾國立大學醫院收集報告,確定42個關鍵詞進行腫瘤-淋巴結(TN)分類,並與臨床專家建立黃金標準。經過訓練,Deductive Mistral-7B模型在資訊提取上表現最佳,準確率達92.24%,TN分類準確率為0.9876,顯示針對性訓練能提升模型性能,對臨床決策有潛在幫助。 PubMed DOI

本研究探討大型語言模型(LLMs),特別是GPT-3.5 turbo和GPT-4,如何提取肝細胞癌病理報告中的關鍵要素。考量到手動整理報告的困難,研究比較了LLMs與傳統的正則表達式(REGEX)方法的準確性。共分析了88份病理報告,重點在五個關鍵要素。結果顯示,LLMs和REGEX的提取準確性均相當,介於84.1%到94.8%之間。研究指出,LLMs有潛力顯著簡化提取過程,進而加速癌症研究的進展。 PubMed DOI

放射學中的結構化報告在可比性、可讀性和細節上有明顯優勢,但其採用仍然有限。本研究探討了一種本地托管的語言模型,能將自由文本的放射報告轉換為結構化數據,且不影響放射科醫師的工作流程。研究結果顯示,該模型生成的結構化報告在英語和德語的準確性接近人類讀者,顯示出良好的性能。結論指出,為了提高結構化報告的採用,需加強自動化系統與臨床流程的整合,讓醫師能在報告過程中受益於結構化數據。 PubMed DOI