原始文章

文件級關係三元組提取在生物醫學文本挖掘中非常重要,尤其是在藥物發現和生物醫學知識圖譜的建立上。不過,現有語言模型在新數據集和關係類型上泛化能力不足,影響其效能。為了解決這個問題,我們提出了一種漸進學習策略,發展出PLRTE模型,透過四級漸進學習過程來增強模型對各種生物醫學關係的理解。實驗結果顯示,我們的模型在DDI和BC5CDR數據集上性能提升5%到20%,並在未見過的Chemprot和GDA數據集上也展現出良好的泛化能力。 PubMed DOI


站上相關主題文章列表

研究探討了使用大型語言模型進行生物醫學關係提取,並引入了LEAP框架,包括自適應調整方法,提高性能。LEAP框架在不同LLM模型上優於傳統調整,在DDI、ChemProt和BioRED等數據集上表現出色。MedLLAMA_13B模型在ChemProt數據集達到95.13的F1分數。LEAP框架為增強生物醫學關係提取的LLM訓練策略提供了有前途的方法。 PubMed DOI

這項研究探討了大型語言模型(LLMs),如GPT-3.5、GPT-4和Llama,在提取針灸穴位位置關係的有效性,特別是使用世界衛生組織的標準作為數據集。研究標註了五種穴位關係,並根據精確度、召回率和F1分數評估模型表現。結果顯示,微調後的GPT-3.5表現最佳,達到最高微平均F1分數0.92,顯示針灸領域的微調對關係提取的重要性。研究建議LLMs可增強針灸的臨床決策支持及教育資源,推進傳統醫學的資訊學發展。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來提升計算藥物重定位的能力,特別是預測藥物與疾病的關聯。傳統方法常受限於不完整的數據,而LLMs能提供豐富的生物醫學知識。研究人員開發了零樣本提示模板,並提出三種模型架構,結果顯示LLM-DDA<sub>GNN-AE</sub>在多項指標上表現優於其他模型。案例研究也證實了該模型在識別可靠藥物與疾病關聯方面的能力,顯示LLMs在藥物重定位及其他生物醫學任務中的潛力。 PubMed DOI

這篇論文探討了一種利用大型語言模型來增強生物醫學關係提取的方法,特別是Gemini和GPT-4。研究中使用GPT-4生成增強的訓練數據,並將這些數據與不同模型的輸出結合,透過集成學習提升預測準確性。此外,Gemini的回應也用來微調BioNLP-PubMed-Bert分類模型。結果顯示,在BioCreative VIII Track 01挑戰的評估數據集上,精確度、召回率和F1分數都有所提升。想了解更多,可以透過提供的網址查詢。 PubMed DOI

實體與關係的聯合提取在資訊擷取中非常重要,尤其是在生物醫學文獻中。本文提出的模型有效解決了句內和句間的提取問題,對於長文本中的長距離依賴關係至關重要。模型結合了多種深度學習技術,如微調的BERT、圖卷積網絡、穩健學習及局部正則化條件隨機場,能準確識別生物醫學文本中的實體,並提取三元組關係。實驗結果顯示該模型在多個數據集上表現優異,促進了生物醫學知識圖譜的構建。相關代碼可在GitHub上獲取。 PubMed DOI

基於變壓器的語言模型在自然語言處理上有顯著進展,但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中,九個預訓練的模型在5,088對藥物-AE數據上微調,並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示,BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測,假陽性減少,精確度提升。整體而言,這些模型在識別因果相關藥物-AE對方面表現優於傳統方法,但仍需額外規則以克服限制。 PubMed DOI

從自由文本醫療紀錄中提取結構化數據,特別是病理報告,面臨不少挑戰。傳統方法因醫療語言複雜而困難重重。這項研究開發了一個端到端的LLM管道,能有效提取病理報告中的診斷、解剖部位等元素。透過人機協作,我們將重大錯誤率降至0.99%。在3520份報告中,識別腎腫瘤亞型的F1分數達0.99,顯示LLM提取管道在良好指示下可達接近專家準確性,並可應用於其他臨床信息提取任務。 PubMed DOI

這項研究探討大型語言模型(LLMs),如GPT-3.5、GPT-4.0和Claude-opus,在化學與疾病關係提取中的挑戰,特別是標註數據不足的情況。研究發現,這些模型在精確提取上達87%的F1分數,但全面提取僅73%。模型在提示工程上的改進有限,且對正向關係的識別較佳。提取錯誤多因模型誤解生物醫學文本的隱含意義。最後,研究提供了增強提取任務的工作流程,並強調優化訓練數據的重要性。 PubMed DOI

TEmbed-DDI 是一種新方法,利用大型語言模型的嵌入技術,結合醫療情境資訊,提升藥物交互作用(DDI)註釋的準確度。它不只看分子結構,還用有意義的文本特徵,讓藥物表示更完整。這方法在西藥和中藥的測試都表現優異,也是首次把中藥納入 DDI 註釋,未來在醫學研究和新藥開發很有潛力。 PubMed DOI

這項研究發現,大型語言模型(LLMs)能自動從文本中擷取蛋白質交互等分子資料,表現比人工處理更有效率。雖然在部分基因細節上還有困難,但整體來說,LLMs有助於加速生物知識的發現與應用。 PubMed DOI