原始文章

這篇評論探討語言模型在蛋白質設計中的應用,將蛋白質視為氨基酸序列,類比於語言模型處理句子中的單詞。文章介紹蛋白質語言模型的基本概念,強調最近的進展,如上下文設計和結構信息整合,並討論目前的限制。此外,評論還建議未來的研究方向,以提升蛋白質語言模型,改善設計結果。 PubMed DOI


站上相關主題文章列表

研究發現,利用蛋白質語言模型能夠改善病毒序列註釋,發現新的病毒蛋白質,並擴展海洋病毒體系的註釋。這種方法在海洋微生物中找到新的DNA編輯蛋白質家族,提升病毒蛋白質的辨識,並帶來新的生物發現。 PubMed DOI

像ProGen2和IgLM這樣的大型語言模型正被應用在蛋白工程領域,以更有效地設計蛋白質。 PubMed DOI

蛋白質語言模型是強大的工具,可預測蛋白質結構、發現新功能性序列,並評估突變影響。研究指出這些模型可預測蛋白質間的相互作用熱點,並與傳統方法媲美。雖然成本效益高,但解釋特定特徵仍具挑戰性。 PubMed DOI

透過序列數據訓練的語言模型可學習蛋白質設計原則,但蛋白功能受結構影響。結合語言模型與結構資訊,可引導蛋白演化,改良抗SARS-CoV-2抗體,增強對病毒變異的中和能力。整合結構數據有助於找出有效蛋白演化路徑,無需特定訓練。 PubMed DOI

大型語言模型(LLMs)正在改變科學界,尤其是生物醫學領域。生物學的重點在於理解生物序列,這與自然語言處理的目標相似。基因組語言模型(gLMs)專門針對DNA序列訓練,能幫助我們更好地理解基因組及DNA元素的互動,進而揭示複雜的生物功能。這篇評論強調了gLMs在適應性預測、序列設計和轉移學習等方面的潛力,但在創建有效的gLMs時仍面臨挑戰,特別是對於大型且複雜的基因組物種。還討論了gLMs開發和評估時需考慮的重要因素。 PubMed DOI

這篇綜述文章全面介紹了大型語言模型(LLMs)和多模態語言模型(MLLMs),涵蓋它們的原理、應用及演變,適合各領域的研究人員、學生和學者閱讀。文章首先解釋了LLMs的技術概念,包括其運作原理和標記化過程,並探討了在生物大分子、醫學科學等領域的應用。接著,討論了LLMs的多模態應用,展示如何整合不同數據類型。最後,文章提到LLMs的挑戰及未來發展,為臨床醫生和科學家提供了重要資源,增進對這些模型的理解。 PubMed DOI

深度生成模型越來越常用於從零開始設計功能性蛋白質。雖然3D蛋白質設計是一種方法,但基於序列的生成方法因為擁有大量的蛋白質序列數據和較簡單的訓練需求而更受歡迎。這些模型專注於匹配訓練數據中的蛋白質序列,但不必每個氨基酸都完全一致,因為某些變異不影響功能。 我們提出了一種新訓練方法,優化氨基酸序列和潛在空間中的訓練數據可能性,並在生成抗微生物肽和蘋果酸脫氫酶上測試,結果超越了多種其他深度生成模型,顯示出我們的方法在功能性蛋白質生成上的有效性。 PubMed DOI

大型語言模型(LLMs)在生物學和化學等複雜領域中影響深遠,特別是在分子設計和優化方面。本篇綜述專注於LLMs在抗生素發現與設計中的應用,特別是肽類分子。我們將探討LLMs在藥物設計的最新進展,以及在抗生素開發中應用這些模型所面臨的挑戰。 PubMed DOI

蛋白質語言模型(pLMs)正逐漸成為理解蛋白質序列及其功能的重要工具,特別是在預測分子功能方面,如識別結合位點和評估基因變異影響。不過,單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM,可以提升其效率和準確性,尤其在實驗數據不足的情況下。總的來說,pLM為計算生物學與實驗生物學的整合鋪路,預示著蛋白質設計的新時代。 PubMed DOI

**重點摘要:** 深度學習已經徹底改變了蛋白質結構預測的領域,成功彌補了大量蛋白質序列與有限實驗決定結構之間的落差。這篇綜述整理了主要的資料庫、深度學習與大型語言模型在蛋白質結構預測上的最新進展,並討論了這個領域未來的挑戰與機會,特別強調其對藥物發現與開發的影響。 PubMed DOI