原始文章

癌症神經符號系統(NSSC)是一個混合型人工智慧框架,專注於提升臨床筆記中腫瘤的識別與連結。它結合了神經符號方法、命名實體識別(NER)和實體連結(EL),能將非結構化的臨床數據轉換為結構化的醫學術語,特別是以統一醫學語言系統(UMLS)為基準。 在針對乳腺癌患者的評估中,NSSC 在實體識別和連結的準確性上顯著優於其他模型,如 BioFalcon 和 scispaCy。這一進展對於提取臨床敘事中的重要見解,並在癌症研究及個人化病患照護上具有潛在應用價值。 PubMed DOI


站上相關主題文章列表

研究比較了不同NLP模型在擷取非小細胞肺癌患者影像報告中的癌症結果。結果顯示,DFCI-ImagingBERT表現最佳,但簡單模型也不錯。若資源有限,簡單機器學習模型仍可有效。 PubMed DOI

大型語言模型在處理自然語言方面有很大潛力,特別是在文本生成、推理和少樣本學習方面表現優秀。然而,在生物醫學領域的命名實體識別方面,LLMs效果不如專門調校的模型好。為了解決這問題,開發了一種新的基於指令的學習方法,創建了BioNER-LLaMA。測試結果顯示,BioNER-LLaMA在生物醫學NER任務中表現優於GPT-4,與專門模型相當。這種方法有潛力提升LLMs在生物醫學和健康領域的競爭力,值得進一步研究。 PubMed DOI

統合報告是一種結構化記錄臨床資訊的方法,有助於提升病患照護品質。本研究利用先進語言模型自動生成癌症相關統合報告,避免昂貴且容易出錯的手動合成。透過調整LLAMA-2模型並使用BERT F1分數評估,研究顯示微調模型能高準確生成統合報告。 PubMed DOI

這篇論文探討流行病學和臨床癌症登記在改善腫瘤醫療及研究中的重要性,特別是在癌症影響日益擴大的情況下。文中指出醫療數據的多樣性帶來挑戰,使得腫瘤手動記錄變得困難。研究提出利用大型語言模型(LLMs)將非結構化醫療報告轉換為德國基本腫瘤數據集所需的結構化格式。結果顯示,將LLMs整合進醫院數據管理或癌症登記系統,能顯著提升癌症數據的質量與完整性,對於有效的診斷、治療及療效評估至關重要。這項研究為人工智慧在醫療數據處理及癌症護理中的潛力提供了新的見解。 PubMed DOI

這項研究探討小型大型語言模型(sLLM)在從病理報告中提取關鍵資訊的效果。使用三個版本的Llama 2模型,參數從70億到700億不等,並在零樣本和五樣本學習情境下進行評估。結果顯示,700億參數的模型在五樣本情境下表現優異,顯示sLLM能有效提升數據提取的效率與準確性。研究強調範例學習的重要性,並討論模型大小、準確性及處理時間的權衡,支持在臨床環境中應用先進語言模型,以改善病人護理和生物醫學研究。 PubMed DOI

這篇論文探討了一種基於變壓器的西班牙臨床文本症狀命名實體識別(NER)方法,並使用SympTEMIST數據集進行多語言實體連結。作者微調了一個基於RoBERTa的標記級分類器,並結合了雙向長短期記憶和條件隨機場層,最終達到0.73的F1分數。實體連結方面,採用混合方法,結合字典和統一醫學語言系統的知識庫,並利用SapBERT生成候選實體,使用GPT-3.5進行重新排序,達到0.73的準確率,超越了之前的紀錄。數據庫可在此網址訪問:https://github.com/svassileva/symptemist-multilingual-linking。 PubMed DOI

罕見疾病的診斷與治療面臨挑戰,因為其發生率低且表現多樣。研究提出一種混合方法,結合字典式自然語言處理(NLP)工具與大型語言模型(LLMs),以提升從非結構化臨床報告中識別罕見疾病的能力。這個框架整合了孤兒病本體和統一醫學語言系統,利用SemEHR工具提取疾病資訊,並透過多種LLMs優化結果。研究顯示,這種方法在識別潛在罕見疾病方面表現優異,顯示出其在臨床應用中的潛力,未來仍需進一步研究以克服相關挑戰。 PubMed DOI

命名實體識別(NER)模型在從非結構化醫療文本中提取結構化資訊方面非常重要,能識別疾病和治療等實體,對臨床決策和研究有幫助。近期基於BERT的深度學習進展提升了NER能力,但醫學術語的複雜性使得模型在不同數據集上的表現不一。本研究評估了七種NER模型在醫療文本分析中的表現,特別關注複雜術語和宏觀因素對準確性的影響。結果顯示,經微調的BERT在某些數據集上表現最佳,並強調了針對性優化的必要性,以增強臨床決策和開發更有效的醫療NER模型。 PubMed DOI

這項研究著重於改善臨床試驗的患者配對過程,傳統上需手動審查電子健康紀錄,常導致患者錯失治療機會。近期大型語言模型的進展讓自動化配對成為可能,但現有研究多依賴有限的合成數據,未能反映真實醫療數據的複雜性。研究者對一個臨床試驗配對系統進行實證評估,使用實際的電子健康紀錄,並引入名為OncoLLM的自訂模型。結果顯示,OncoLLM的表現超越GPT-3.5,與醫生的效果相當,可能顯著提升患者配對效率,改善治療選擇的可及性。 PubMed DOI

這項研究探討了研究人員在處理大量生物醫學文獻時的挑戰,並提出了一種混合方法,結合文本挖掘、圖神經網絡(GNNs)和微調的大型語言模型(LLMs)。這種方法旨在增強生物醫學知識圖譜,並解釋預測的關係。研究顯示,該方法在蛋白質相互作用數據集上達到0.772的馬修斯相關係數,並在失眠研究中識別出25個新的人類蛋白質相互作用。這種方法有助於加速治療靶點的發現,並提高文獻分析的效率。 PubMed DOI