原始文章

Protein CREATE(計算重設透過實驗增強訓練引擎)是一個創新的流程,結合計算設計與實驗驗證,提升蛋白質結合劑的開發效率。透過先進技術如下一代測序和噬菌體展示,研究人員能夠收集大量的結合數據,並生成數千種針對IL-7受體α和胰島素受體的設計結合劑。這項研究不僅發現了新的結合劑,還提供了結合特性的深入見解,強調結構特徵的重要性,並促進設計-建造-測試的閉環循環,未來將更精確地設計蛋白質結合劑。 PubMed DOI


站上相關主題文章列表

透過序列數據訓練的語言模型可學習蛋白質設計原則,但蛋白功能受結構影響。結合語言模型與結構資訊,可引導蛋白演化,改良抗SARS-CoV-2抗體,增強對病毒變異的中和能力。整合結構數據有助於找出有效蛋白演化路徑,無需特定訓練。 PubMed DOI

提議的PALM-H3模型旨在簡化抗體設計,專注於生成針對特定抗原的人工抗體,特別是重鏈互補決定區域3(CDRH3),減少了從血清中分離天然抗體的需求,節省資源和時間。此外,A2binder模型可預測抗原與抗體的結合特異性。PALM-H3生成的抗體對SARS-CoV-2抗原,包括XBB變異株,顯示出高結合親和力和強中和能力。透過Roformer架構的注意力機制,增強了模型的可解釋性,為抗體設計提供了重要見解,代表抗體工程的一大進展。 PubMed DOI

肽類療法在治療糖尿病和癌症方面表現出色,特別是GLP-1受體激動劑對2型糖尿病和肥胖症的療效。然而,設計符合多重標準的肽類仍具挑戰。為此,我們推出了PepTune,一種專門用於生成和優化治療性肽的模型。透過蒙地卡羅樹搜索策略,PepTune能有效平衡探索與利用,生成具多樣化特性的肽,並解決了在離散空間中面臨的挑戰。我們的研究顯示,這種方法在肽設計上具備穩健性與靈活性。 PubMed DOI

深度生成模型越來越常用於從零開始設計功能性蛋白質。雖然3D蛋白質設計是一種方法,但基於序列的生成方法因為擁有大量的蛋白質序列數據和較簡單的訓練需求而更受歡迎。這些模型專注於匹配訓練數據中的蛋白質序列,但不必每個氨基酸都完全一致,因為某些變異不影響功能。 我們提出了一種新訓練方法,優化氨基酸序列和潛在空間中的訓練數據可能性,並在生成抗微生物肽和蘋果酸脫氫酶上測試,結果超越了多種其他深度生成模型,顯示出我們的方法在功能性蛋白質生成上的有效性。 PubMed DOI

這項研究強調了先進的大型語言模型(LLM),特別是Pro-PRIME模型,在增強結合生長激素的VHH抗體的穩定性方面的成效。考慮到蛋白質常需在極端環境中運作,研究探討了設計更高穩定性和功能性蛋白質的挑戰。經過兩輪設計,成功產生了一種突變抗體,具備更好的熱穩定性、極端pH抵抗力及更強的結合親和力。這是LLM設計的蛋白質產品首次成功應用於大規模生產,顯示其在蛋白質工程上的潛力。 PubMed DOI

這項研究探討如何利用計算設計來結合新型表位的T細胞受體(TCR),面對的挑戰是缺乏相關數據。研究人員提出了一種新方法,運用上下文學習來增強TCR的生成。主要策略包括: 1. **上下文訓練**:透過目標表位和已知TCR訓練模型,提升TCR生成的準確性。 2. **自我反思提示**:模型根據目標表位自生成上下文TCR,並在推斷中使用。 實驗結果顯示,這種方法顯著提升了新型表位的TCR質量,並有潛力推進靶向免疫療法。 PubMed DOI

治療性抗體的開發面臨預測表位的挑戰,這對抗體設計至關重要。本研究提出三種創新方法來預測表位關係: 1. **序列同一性分析**:分析1800萬對抗體,發現CDRH3序列同一性超過70%可可靠指示重疊表位。 2. **對比學習框架**:開發監督式對比微調方法,對抗體語言模型進行調整,達到82.7%準確率,優於傳統模型。 3. **AbLang-PDB模型**:創建通用模型,預測重疊表位抗體,精確度提高五倍。 這些模型為抗體發現提供了有價值的工具,並顯示對比學習的有效性。 PubMed DOI

目前人類抗體序列的多樣性了解有限,因為現有檢測方法又貴又沒效率。作者開發了IgHuAb大型語言模型,能產生大量成對人類抗體序列,並建立了SynAbLib合成抗體庫,不只反映自然多樣性,還有更高變化。實驗證明,SynAbLib的抗體表現很好。這些工具提供一種可擴展的方法,能快速產生和搜尋理想人類抗體。 PubMed DOI

胜肽能自組裝成多功能材料,應用於生醫和奈米科技,但因序列多樣、實驗變異大,設計上很困難。機器學習有助於發現新型自組裝胜肽,但需高品質資料、專業知識,且要納入失敗案例。結合先進AI和可解釋分析,可加速胜肽奈米材料的研發。 PubMed DOI

作者提出一套新方法,結合半監督神經網路(Seq2Fitness)和創新最佳化演算法(BADASS),能更準確預測蛋白質適應度,並有效率產生多樣且高適應度的蛋白質序列。這方法比現有技術更省資源、效果更好,未來也有機會應用在 DNA、RNA 等其他生物序列上。 PubMed DOI