原始文章

這項研究專注於鮮味肽,透過蛋白質語言模型分析其特性。研究人員收集了 IC<sub>50</sub> 和 <i>K</i><sub>d</sub> 數據,建立預測蛋白質-肽親和力的模型,並檢視鮮味肽與味覺受體的關係。結果顯示,鮮味肽對鮮味受體的親和力較強,但對苦味受體則無顯著差異。研究編制了972種鮮味肽和608種非鮮味肽的數據集,並開發出準確率達82%的預測模型,還創建了使用者友好的網站UmamiMeta,成為鮮味肽分析的資源。 PubMed DOI


站上相關主題文章列表

核糖體合成及後轉譯修飾的肽類(RiPPs)由酶產生,這些酶的底物偏好往往難以預測。大型語言模型(LLMs)在預測這些偏好上顯示潛力,但通常依賴有限的肽序列數據。針對乳酸酯生物合成途徑的研究發現,對LazBF和LazDEF兩種酶的底物數據進行掩碼語言建模,可以提升對這兩種酶的預測準確性。這顯示模型能學習同一路徑內不同酶的功能轉移,並且針對特定數據集進行微調能顯著改善預測,對設計RiPP生物合成途徑的底物庫有幫助。 PubMed DOI

肽類療法在治療糖尿病和癌症方面表現出色,特別是GLP-1受體激動劑對2型糖尿病和肥胖症的療效。然而,設計符合多重標準的肽類仍具挑戰。為此,我們推出了PepTune,一種專門用於生成和優化治療性肽的模型。透過蒙地卡羅樹搜索策略,PepTune能有效平衡探索與利用,生成具多樣化特性的肽,並解決了在離散空間中面臨的挑戰。我們的研究顯示,這種方法在肽設計上具備穩健性與靈活性。 PubMed DOI

這項研究中,研究人員開發了一個模型來預測抗菌肽對大腸桿菌的最小抑菌濃度(MIC)。他們使用3143種肽的數據集進行訓練,並用786種肽進行驗證,所有數據均為實驗確定。研究強調了組成增強轉移和分佈特徵的重要性。最初的BLAST相似性搜索未能有效預測,因此轉向機器學習回歸模型,結合多種特徵進行優化。隨機森林回歸器在驗證集上表現良好,並在獨立數據集上超越現有方法。此外,研究人員還創建了"EIPpred"平台,幫助用戶設計特定MIC值的肽。 PubMed DOI

大型語言模型(LLMs)在生物學和化學等複雜領域中影響深遠,特別是在分子設計和優化方面。本篇綜述專注於LLMs在抗生素發現與設計中的應用,特別是肽類分子。我們將探討LLMs在藥物設計的最新進展,以及在抗生素開發中應用這些模型所面臨的挑戰。 PubMed DOI

AMP-Designer 是一種創新的方法,利用大型語言模型設計抗微生物肽 (AMPs)。在短短 11 天內,成功設計出 18 種對革蘭氏陰性菌有效的 AMP,體外測試成功率高達 94.4%。其中兩個候選者展現出強大的抗菌活性、低血毒性及在人體血漿中的穩定性,並在小鼠肺部感染研究中顯著減少細菌負荷。整個過程從設計到驗證僅需 48 天,特別適合針對特定細菌株,顯示出對抗抗生素抗藥性的潛力。 PubMed DOI

抗微生物肽(AMPs)因其強大的抗微生物能力,正成為對抗抗生素抗藥性的新解決方案。傳統的AMP識別方法耗時且需大量人力,但隨著深度學習的進步,特別是蛋白質語言模型(PLMs),我們開發了PLAPD框架,利用預訓練的ESM2模型進行AMP分類。經過評估,PLAPD在準確率、精確率、特異性等指標上表現優異,顯示其作為高效AMP發現工具的潛力。 PubMed DOI

這項研究聚焦於肽的自組裝,肽是形成多種結構的重要生物分子。雖然過去的研究探討了化學成分和外部條件對自組裝的影響,但缺乏全面的分析。為了解決這個問題,作者建立了一個肽組裝資料庫,結合專家整理和大型語言模型進行文獻挖掘,編輯了超過1000個實驗條目,詳細記錄肽的序列和條件。開發的機器學習模型達到超過80%的準確率,並微調了GPT模型以提升文獻挖掘的表現,進一步理解肽自組裝的機制。 PubMed DOI

這項研究提出了PKAN新架構,結合多模態表徵和語言模型概念,能更準確預測胜肽的活性與功能,表現優於現有方法。PKAN也有助於解析影響胜肽功能的關鍵特徵,推動生物學上胜肽語言模型的發展。 PubMed DOI

NeuroScale 是新一代深度學習模型,結合演化蛋白質建模和多尺度神經網路(GoogLeNet),能精準預測神經肽(AUC 超過 0.97),不論序列相似度或長度都很穩定,非常適合用來發現神經肽和開發肽類藥物。 PubMed DOI

UniDL4BioPep 是一套簡單好上手的機器學習工具,專門幫忙找生物活性胜肽。它用先進的蛋白質語言模型(像 ESM),大幅減少模型開發的難度和時間。就算是做濕實驗的研究人員,也能一鍵快速建立、客製化預測模型,特別適合做二元分類。本章會介紹它的技術細節和實際用法。 PubMed DOI