原始文章

這項研究強調了先進的大型語言模型(LLM),特別是Pro-PRIME模型,在增強結合生長激素的VHH抗體的穩定性方面的成效。考慮到蛋白質常需在極端環境中運作,研究探討了設計更高穩定性和功能性蛋白質的挑戰。經過兩輪設計,成功產生了一種突變抗體,具備更好的熱穩定性、極端pH抵抗力及更強的結合親和力。這是LLM設計的蛋白質產品首次成功應用於大規模生產,顯示其在蛋白質工程上的潛力。 PubMed DOI


站上相關主題文章列表

透過序列數據訓練的語言模型可學習蛋白質設計原則,但蛋白功能受結構影響。結合語言模型與結構資訊,可引導蛋白演化,改良抗SARS-CoV-2抗體,增強對病毒變異的中和能力。整合結構數據有助於找出有效蛋白演化路徑,無需特定訓練。 PubMed DOI

提議的PALM-H3模型旨在簡化抗體設計,專注於生成針對特定抗原的人工抗體,特別是重鏈互補決定區域3(CDRH3),減少了從血清中分離天然抗體的需求,節省資源和時間。此外,A2binder模型可預測抗原與抗體的結合特異性。PALM-H3生成的抗體對SARS-CoV-2抗原,包括XBB變異株,顯示出高結合親和力和強中和能力。透過Roformer架構的注意力機制,增強了模型的可解釋性,為抗體設計提供了重要見解,代表抗體工程的一大進展。 PubMed DOI

這項研究提出了一個新框架,結合大型語言模型(LLMs)和遺傳演算法(GAs),用來優化酶的設計,解決蛋白質序列及功能的複雜挑戰。研究人員透過大量蛋白質序列數據,找出影響酶結構和功能的氨基酸關係,並利用遺傳演算法有效搜尋能提升催化性能的酶序列。測試結果顯示,生成的酶突變體在90%的案例中超越野生型酶,並維持相似的結構特徵,顯示這種方法的有效性,推進了生物催化劑設計的計算方法。 PubMed DOI

深度生成模型越來越常用於從零開始設計功能性蛋白質。雖然3D蛋白質設計是一種方法,但基於序列的生成方法因為擁有大量的蛋白質序列數據和較簡單的訓練需求而更受歡迎。這些模型專注於匹配訓練數據中的蛋白質序列,但不必每個氨基酸都完全一致,因為某些變異不影響功能。 我們提出了一種新訓練方法,優化氨基酸序列和潛在空間中的訓練數據可能性,並在生成抗微生物肽和蘋果酸脫氫酶上測試,結果超越了多種其他深度生成模型,顯示出我們的方法在功能性蛋白質生成上的有效性。 PubMed DOI

大型語言模型(LLMs)在生物學和化學等複雜領域中影響深遠,特別是在分子設計和優化方面。本篇綜述專注於LLMs在抗生素發現與設計中的應用,特別是肽類分子。我們將探討LLMs在藥物設計的最新進展,以及在抗生素開發中應用這些模型所面臨的挑戰。 PubMed DOI

我們開發了一個自動化工具,利用大型語言模型(LLM)來簡化從超過81,000篇與蛋白質資料庫(PDB)相關的文章中提取和分類蛋白質的表達及純化方法。這個工具能有效解決優化蛋白質樣本的挑戰,因為表達條件和純化策略的變化常常耗時。主要發現包括:Tris緩衝液最常用,聚組氨酸標籤佔主導,最佳表達溫度為16-20 °C,誘導時間偏好12-16小時。這個資源對研究人員設計蛋白質實驗非常有幫助。 PubMed DOI

蛋白質語言模型(pLMs)正逐漸成為理解蛋白質序列及其功能的重要工具,特別是在預測分子功能方面,如識別結合位點和評估基因變異影響。不過,單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM,可以提升其效率和準確性,尤其在實驗數據不足的情況下。總的來說,pLM為計算生物學與實驗生物學的整合鋪路,預示著蛋白質設計的新時代。 PubMed DOI

傳統抗體發現方法效率低、成本高且成功率不佳。為了解決這些問題,最近引入了人工智慧(AI)技術來增強和創造新的抗體序列。本研究介紹了MAGE(單克隆抗體生成器),這是一種專門設計的蛋白質語言模型,能生成針對不同目標的人類抗體序列。MAGE已成功產生新穎且多樣的抗體,並在實驗中證實其對SARS-CoV-2、禽流感H5N1和RSV-A的結合特異性,成為針對多目標抗體設計的先驅工具。 PubMed DOI

這項研究介紹了一種新方法,利用名為NanoAbLLaMA的蛋白質大型語言模型來創建合成納米抗體庫,簡化了傳統的建庫過程。該模型基於LLaMA2,經過120,000個納米抗體序列的微調,能根據特定胚系生成序列,準確率高達100%。雖然這方法顯著減少了時間和資源需求,但仍有胚系覆蓋範圍有限的限制。未來可望擴展胚系多樣性並納入藥物可行性指標,相關代碼和資源已公開,鼓勵更多人使用。 PubMed DOI

作者提出一套新方法,結合半監督神經網路(Seq2Fitness)和創新最佳化演算法(BADASS),能更準確預測蛋白質適應度,並有效率產生多樣且高適應度的蛋白質序列。這方法比現有技術更省資源、效果更好,未來也有機會應用在 DNA、RNA 等其他生物序列上。 PubMed DOI