原始文章

整合生物醫學知識對改善醫療診斷和個人化治療至關重要,但面臨數據集術語不一致的挑戰。生物醫學實體對齊是關鍵,需識別不同數據集中的等效實體。近期,大型語言模型(LLMs)如BERT在處理異質數據上顯示潛力,但無單一模型能解決所有實體匹配問題。為此,我們提出兩階段LLM構建框架(TSLLM),透過多目標和單目標遺傳算法自適應選擇和結合LLM,提升異質實體的區分能力。測試結果顯示,TSLLM在實體匹配上表現優於現有技術。 PubMed DOI


站上相關主題文章列表

醫學領域中,找到正確資訊很重要。這篇論文提出使用大型語言模型和生成模型來改善消除歧義,方法是增加相關內容的實例來擴充資料集。結合BlueBERT、Transformers和BIOGPT,產生多樣臨床文本實例。在CASI資料集上評估,方法提升效能,特別對有限實例的情況,解決資料不均和類似概念挑戰。結果顯示,大型語言模型和生成技術有效,模型準確度高於先前方法。 PubMed DOI

研究利用大型語言模型來增進生物醫學知識圖譜,訓練生物醫學和臨床領域的語義模型。提出新方法,包括改進的對比學習、自我蒸餾和權重平均,生成準確的生物醫學概念和句子表示。通過各種任務評估,顯示相對現有方法的明顯改進。推出新英文最先進的生物醫學模型,以及支援50多種語言的多語言模型,有助於全球臨床流程和生物信息學研究。BioLORD-2023模型旨在成為未來生物醫學應用的重要工具。 PubMed DOI

大型語言模型在處理自然語言方面有很大潛力,特別是在文本生成、推理和少樣本學習方面表現優秀。然而,在生物醫學領域的命名實體識別方面,LLMs效果不如專門調校的模型好。為了解決這問題,開發了一種新的基於指令的學習方法,創建了BioNER-LLaMA。測試結果顯示,BioNER-LLaMA在生物醫學NER任務中表現優於GPT-4,與專門模型相當。這種方法有潛力提升LLMs在生物醫學和健康領域的競爭力,值得進一步研究。 PubMed DOI

罕見疾病的診斷與治療面臨挑戰,因為其發生率低且表現多樣。研究提出一種混合方法,結合字典式自然語言處理(NLP)工具與大型語言模型(LLMs),以提升從非結構化臨床報告中識別罕見疾病的能力。這個框架整合了孤兒病本體和統一醫學語言系統,利用SemEHR工具提取疾病資訊,並透過多種LLMs優化結果。研究顯示,這種方法在識別潛在罕見疾病方面表現優異,顯示出其在臨床應用中的潛力,未來仍需進一步研究以克服相關挑戰。 PubMed DOI

這項研究探討大型語言模型(LLMs)在提升病人與臨床試驗(CTs)匹配的應用,並以資訊檢索為框架。研究開發了一個多階段檢索管道,結合BM25、Transformer排名器及LLM方法,數據來自TREC臨床試驗2021-23。結果顯示,微調的LLM在查詢形成、過濾及重新排名上表現優於傳統方法,提升了識別合格試驗的有效性。雖然LLMs具競爭力,但計算成本較高,效率降低。未來研究應聚焦於優化成本與檢索有效性之間的平衡。 PubMed DOI

這項研究全面探討大型語言模型(LLMs)在生物醫學與健康資訊學(BHI)的應用,強調其變革潛力及面臨的倫理與實際挑戰。透過分析1,698篇研究,發現LLMs在臨床決策支持、病患互動及醫療文件分析等領域的應用顯著增加,預期能提升診斷準確性。研究也揭示機構間的合作動態,特別是在心理健康和神經系統疾病的管理上,顯示出個人化醫療的潛力。儘管LLMs展現出巨大潛力,仍需重視倫理影響及模型驗證挑戰,以確保其在臨床上的有效性。 PubMed DOI

實體與關係的聯合提取在資訊擷取中非常重要,尤其是在生物醫學文獻中。本文提出的模型有效解決了句內和句間的提取問題,對於長文本中的長距離依賴關係至關重要。模型結合了多種深度學習技術,如微調的BERT、圖卷積網絡、穩健學習及局部正則化條件隨機場,能準確識別生物醫學文本中的實體,並提取三元組關係。實驗結果顯示該模型在多個數據集上表現優異,促進了生物醫學知識圖譜的構建。相關代碼可在GitHub上獲取。 PubMed DOI

阿茲海默症是一種漸進性的神經系統疾病,影響全球數百萬人,導致認知能力下降和記憶喪失。傳統診斷方法難以早期檢測。本研究提出一種新方法,結合自然語言處理和大型語言模型,利用GenBERT來識別阿茲海默症的生物標記。透過整合臨床數據,GenBERT在早期預測方面表現優異,準確率達98.30%,並顯示出高敏感性和特異性,為阿茲海默症的早期診斷提供了可靠工具,可能改變未來的檢測與治療策略。 PubMed DOI

這項研究介紹了MedAdapter,一種新方法,能讓大型語言模型(LLMs)在生物醫學領域適應,而不需微調整個模型。MedAdapter使用小型的BERT適配器來排名LLMs生成的候選解,提升測試時的適應性。實驗顯示,MedAdapter在四個生物醫學任務上,白盒和黑盒LLMs的性能分別提升了18.24%和10.96%。這種方法資源效率高,且保護數據隱私,適合現有方法的靈活選擇。 PubMed DOI

這項研究針對醫學文本中的表型資訊進行精確對齊,旨在提升智能醫療應用,如檢索相似病患案例。作者提出了表型語義結構單元(PhenoSSU)及自動提取演算法,並探索多種對齊策略,發現數據驅動的方法效果最佳。基於BERT的模型對短語型PhenoSSU有效,而知識基礎方法則適合邏輯型PhenoSSU。最終開發的PhenoAlign工具在金標準測試集上表現優異,F1分數達0.820,顯示其在病患照護和醫學研究中的潛力。 PubMed DOI