原始文章

整合生物醫學知識對改善醫療診斷和個人化治療至關重要,但面臨數據集術語不一致的挑戰。生物醫學實體對齊是關鍵,需識別不同數據集中的等效實體。近期,大型語言模型(LLMs)如BERT在處理異質數據上顯示潛力,但無單一模型能解決所有實體匹配問題。為此,我們提出兩階段LLM構建框架(TSLLM),透過多目標和單目標遺傳算法自適應選擇和結合LLM,提升異質實體的區分能力。測試結果顯示,TSLLM在實體匹配上表現優於現有技術。 PubMed DOI


站上相關主題文章列表

研究使用大型語言模型(LLMs)探討基於知識的基因優先順序和選擇,專注於與紅血球特徵相關的血液轉錄模組。結果顯示,OpenAI的GPT-4和Anthropic的Claude在LLMs中表現最佳。研究找出了模組M9.2的頂尖基因候選者,顯示LLMs在基因選擇上的潛力,有助於提升生物醫學知識的應用價值。 PubMed DOI

醫學領域中,找到正確資訊很重要。這篇論文提出使用大型語言模型和生成模型來改善消除歧義,方法是增加相關內容的實例來擴充資料集。結合BlueBERT、Transformers和BIOGPT,產生多樣臨床文本實例。在CASI資料集上評估,方法提升效能,特別對有限實例的情況,解決資料不均和類似概念挑戰。結果顯示,大型語言模型和生成技術有效,模型準確度高於先前方法。 PubMed DOI

研究利用大型語言模型來增進生物醫學知識圖譜,訓練生物醫學和臨床領域的語義模型。提出新方法,包括改進的對比學習、自我蒸餾和權重平均,生成準確的生物醫學概念和句子表示。通過各種任務評估,顯示相對現有方法的明顯改進。推出新英文最先進的生物醫學模型,以及支援50多種語言的多語言模型,有助於全球臨床流程和生物信息學研究。BioLORD-2023模型旨在成為未來生物醫學應用的重要工具。 PubMed DOI

大型語言模型在處理自然語言方面有很大潛力,特別是在文本生成、推理和少樣本學習方面表現優秀。然而,在生物醫學領域的命名實體識別方面,LLMs效果不如專門調校的模型好。為了解決這問題,開發了一種新的基於指令的學習方法,創建了BioNER-LLaMA。測試結果顯示,BioNER-LLaMA在生物醫學NER任務中表現優於GPT-4,與專門模型相當。這種方法有潛力提升LLMs在生物醫學和健康領域的競爭力,值得進一步研究。 PubMed DOI

罕見疾病的診斷與治療面臨挑戰,因為其發生率低且表現多樣。研究提出一種混合方法,結合字典式自然語言處理(NLP)工具與大型語言模型(LLMs),以提升從非結構化臨床報告中識別罕見疾病的能力。這個框架整合了孤兒病本體和統一醫學語言系統,利用SemEHR工具提取疾病資訊,並透過多種LLMs優化結果。研究顯示,這種方法在識別潛在罕見疾病方面表現優異,顯示出其在臨床應用中的潛力,未來仍需進一步研究以克服相關挑戰。 PubMed DOI

這項研究探討大型語言模型(LLMs)在提升病人與臨床試驗(CTs)匹配的應用,並以資訊檢索為框架。研究開發了一個多階段檢索管道,結合BM25、Transformer排名器及LLM方法,數據來自TREC臨床試驗2021-23。結果顯示,微調的LLM在查詢形成、過濾及重新排名上表現優於傳統方法,提升了識別合格試驗的有效性。雖然LLMs具競爭力,但計算成本較高,效率降低。未來研究應聚焦於優化成本與檢索有效性之間的平衡。 PubMed DOI

這項研究探討如何將大型語言模型(LLMs)整合進證據基礎醫學(EBM),以自動化任務如證據檢索和傳播,來提升臨床決策。研究比較了七個LLMs的表現,結果顯示這些模型在理解和總結方面表現優異,知識引導的提示也顯著提升了效果。不過,在命名實體識別和事實準確性上仍面臨挑戰,需要進一步研究和質量控制才能應用於臨床。研究結果和代碼已在GitHub上公開。 PubMed DOI

這項研究全面探討大型語言模型(LLMs)在生物醫學與健康資訊學(BHI)的應用,強調其變革潛力及面臨的倫理與實際挑戰。透過分析1,698篇研究,發現LLMs在臨床決策支持、病患互動及醫療文件分析等領域的應用顯著增加,預期能提升診斷準確性。研究也揭示機構間的合作動態,特別是在心理健康和神經系統疾病的管理上,顯示出個人化醫療的潛力。儘管LLMs展現出巨大潛力,仍需重視倫理影響及模型驗證挑戰,以確保其在臨床上的有效性。 PubMed DOI

這項研究探討了基於Transformer的預訓練大型語言模型(LLMs)在生物醫學領域的適應性與表現,特別針對自然語言推理(NLI)和命名實體識別(NER)兩個任務。研究旨在了解模型在這些任務上的表現與其捕捉資訊的能力之間的關係。分析了編碼器和解碼器基礎的LLMs的內部編碼及注意力機制,並比較了不同數據量微調前後的效果。結果顯示,模型的有效性與其內部機制中的特定模式有關,並提供了LLMs在生物醫學領域如何處理知識的見解。研究源代碼已在GitHub上公開。 PubMed DOI

這項研究探討結合檢索增強生成(RAG)模型與大型語言模型(LLM),以提升國際詞彙中藥物名稱對應的準確性。研究過程中,將藥物成分名稱翻譯成英文,並使用日本藥品名稱,從OHDSI標準詞彙中提取藥物概念。結果顯示,LLM + RAG的組合表現顯著優於傳統方法,命中率超過90%,而基準僅64%。此外,r-precision指標也從23%提升至41%至50%。整體而言,RAG與LLM的整合提供了更有效的全球藥物資訊對應方法。 PubMed DOI