原始文章

ProteinMPNN 是一個幫助設計蛋白質的工具,能識別特定三維結構的氨基酸序列。我們對其進行了修改,目的是創造對細胞毒性 T 淋巴細胞不那麼明顯的蛋白質,因為這些細胞透過 MHC-I 路徑來識別蛋白質。我們引入了結合直接偏好優化(DPO)的方法,並預測 MHC-I 肽的呈現,成功設計出具有較少 MHC-I 表位的蛋白質,且不影響其結構完整性。詳細的源代碼可在這裡找到:https://github.com/hcgasser/CAPE_MPNN。 PubMed DOI


站上相關主題文章列表

像ProGen2和IgLM這樣的大型語言模型正被應用在蛋白工程領域,以更有效地設計蛋白質。 PubMed DOI

蛋白質在藥物研發中扮演重要角色,但傳統方法太貴又太慢。研究引入了一個快速又精確的分類器,使用了帶有ESM-2嵌入的蛋白質語言模型(PLM),準確率達95.11%。比較結果顯示,ESM-2嵌入比PSSM特徵更優。同時,開發了基於GPT-2的端對端模型,將大型語言模型成功應用在蛋白質辨識上,並經Pharos數據集驗證表現。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)預測蛋白質相變(PPTs),對於理解與年齡相關的疾病如阿茲海默症非常重要。研究者微調了一個LLM,評估蛋白質序列變異對PPTs的影響,結果顯示該模型的表現超越傳統方法,並結合隨機森林模型提升可解釋性。此外,研究發現阿茲海默症相關蛋白質的聚集增加與基因表達下降有關,暗示可能存在自然防禦機制來對抗該疾病。 PubMed DOI

主要組織相容性複合體(MHC)在將表位呈現給T細胞受體中扮演關鍵角色,啟動免疫反應。傳統疫苗設計通常需透過昂貴的高通量篩選來找出高MHC結合親和力的表位。近期,人工智慧(AI)在蛋白質結構預測等領域展現潛力。我們提出了一種基於深度強化學習的生成算法RLpMIEC,能有效設計出結合MHC-I系統的肽,並具備高可解釋性,對加速肽基疫苗開發具有重要意義。 PubMed DOI

這項研究推出了一個名為蛋白質重要性計算器(PIC)的深度學習模型,旨在提升人類必需蛋白質(HEPs)的識別。傳統方法成本高且勞動密集,且多數僅能在細胞系層面預測HEPs,無法適應不同生物背景。PIC透過微調的蛋白質語言模型,能在三個層面(人類、細胞系、小鼠)更準確地預測HEPs,並引入蛋白質重要性分數來量化其必需性。這個分數經過生物分析驗證,顯示在乳腺癌預後生物標記識別上有潛力,並可評估大量人類微蛋白質的必需性,展現其在生物醫學研究中的廣泛應用。 PubMed DOI

蛋白質對生物功能至關重要,而可控的蛋白質編輯技術進步讓我們能更深入探索自然系統及開發新藥物。機器學習輔助的蛋白質編輯(MLPE)雖然有潛力,但面臨組合可能性廣泛的挑戰。為此,我們提出了ProtET,透過多模態學習進行高效蛋白質編輯,並在實驗中顯示其在滿足人類期望的屬性上表現優於現有方法,特別是在穩定性方面有顯著改善。ProtET將成為推進人工蛋白質編輯的重要工具,滿足學術及產業需求。 PubMed DOI

肽類療法在治療糖尿病和癌症方面表現出色,特別是GLP-1受體激動劑對2型糖尿病和肥胖症的療效。然而,設計符合多重標準的肽類仍具挑戰。為此,我們推出了PepTune,一種專門用於生成和優化治療性肽的模型。透過蒙地卡羅樹搜索策略,PepTune能有效平衡探索與利用,生成具多樣化特性的肽,並解決了在離散空間中面臨的挑戰。我們的研究顯示,這種方法在肽設計上具備穩健性與靈活性。 PubMed DOI

深度生成模型越來越常用於從零開始設計功能性蛋白質。雖然3D蛋白質設計是一種方法,但基於序列的生成方法因為擁有大量的蛋白質序列數據和較簡單的訓練需求而更受歡迎。這些模型專注於匹配訓練數據中的蛋白質序列,但不必每個氨基酸都完全一致,因為某些變異不影響功能。 我們提出了一種新訓練方法,優化氨基酸序列和潛在空間中的訓練數據可能性,並在生成抗微生物肽和蘋果酸脫氫酶上測試,結果超越了多種其他深度生成模型,顯示出我們的方法在功能性蛋白質生成上的有效性。 PubMed DOI

這項研究強調了先進的大型語言模型(LLM),特別是Pro-PRIME模型,在增強結合生長激素的VHH抗體的穩定性方面的成效。考慮到蛋白質常需在極端環境中運作,研究探討了設計更高穩定性和功能性蛋白質的挑戰。經過兩輪設計,成功產生了一種突變抗體,具備更好的熱穩定性、極端pH抵抗力及更強的結合親和力。這是LLM設計的蛋白質產品首次成功應用於大規模生產,顯示其在蛋白質工程上的潛力。 PubMed DOI

蛋白質語言模型(pLMs)正逐漸成為理解蛋白質序列及其功能的重要工具,特別是在預測分子功能方面,如識別結合位點和評估基因變異影響。不過,單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM,可以提升其效率和準確性,尤其在實驗數據不足的情況下。總的來說,pLM為計算生物學與實驗生物學的整合鋪路,預示著蛋白質設計的新時代。 PubMed DOI