這項研究探討如何利用自然語言處理(NLP)和生成語言模型(GLMs)從肺癌患者的病理報告中提取關鍵資訊。研究目的是評估這些模型在提取病理階段數據的有效性,並考慮在資源有限的情況下使用較小型GLMs的可行性。研究團隊從首爾國立大學醫院收集報告,確定42個關鍵詞進行腫瘤-淋巴結(TN)分類,並與臨床專家建立黃金標準。經過訓練,Deductive Mistral-7B模型在資訊提取上表現最佳,準確率達92.24%,TN分類準確率為0.9876,顯示針對性訓練能提升模型性能,對臨床決策有潛在幫助。
PubMed
DOI