原始文章

NeuroScale 是新一代深度學習模型,結合演化蛋白質建模和多尺度神經網路(GoogLeNet),能精準預測神經肽(AUC 超過 0.97),不論序列相似度或長度都很穩定,非常適合用來發現神經肽和開發肽類藥物。 PubMed DOI


站上相關主題文章列表

這項研究開發了一種名為DeepAIP的深度學習模型,專門用來預測抗炎肽(AIPs)。由於傳統的抗炎治療方法如NSAIDs和糖皮質激素常有副作用,尋找替代療法變得相當重要。DeepAIP結合了上下文自注意力機制和預訓練的蛋白質語言模型,顯著提高了預測準確性。測試中,Prot-T5表現最佳,DeepAIP的表現超越現有方法,成功識別17個新型抗炎肽序列。研究數據和代碼已在GitHub上公開。 PubMed DOI

這項研究推出了一個名為蛋白質重要性計算器(PIC)的深度學習模型,旨在提升人類必需蛋白質(HEPs)的識別。傳統方法成本高且勞動密集,且多數僅能在細胞系層面預測HEPs,無法適應不同生物背景。PIC透過微調的蛋白質語言模型,能在三個層面(人類、細胞系、小鼠)更準確地預測HEPs,並引入蛋白質重要性分數來量化其必需性。這個分數經過生物分析驗證,顯示在乳腺癌預後生物標記識別上有潛力,並可評估大量人類微蛋白質的必需性,展現其在生物醫學研究中的廣泛應用。 PubMed DOI

大型語言模型(LLMs)在生物學和化學等複雜領域中影響深遠,特別是在分子設計和優化方面。本篇綜述專注於LLMs在抗生素發現與設計中的應用,特別是肽類分子。我們將探討LLMs在藥物設計的最新進展,以及在抗生素開發中應用這些模型所面臨的挑戰。 PubMed DOI

抗微生物肽(AMPs)因其強大的抗微生物能力,正成為對抗抗生素抗藥性的新解決方案。傳統的AMP識別方法耗時且需大量人力,但隨著深度學習的進步,特別是蛋白質語言模型(PLMs),我們開發了PLAPD框架,利用預訓練的ESM2模型進行AMP分類。經過評估,PLAPD在準確率、精確率、特異性等指標上表現優異,顯示其作為高效AMP發現工具的潛力。 PubMed DOI

這項研究聚焦於肽的自組裝,肽是形成多種結構的重要生物分子。雖然過去的研究探討了化學成分和外部條件對自組裝的影響,但缺乏全面的分析。為了解決這個問題,作者建立了一個肽組裝資料庫,結合專家整理和大型語言模型進行文獻挖掘,編輯了超過1000個實驗條目,詳細記錄肽的序列和條件。開發的機器學習模型達到超過80%的準確率,並微調了GPT模型以提升文獻挖掘的表現,進一步理解肽自組裝的機制。 PubMed DOI

這項研究專注於鮮味肽,透過蛋白質語言模型分析其特性。研究人員收集了 IC<sub>50</sub> 和 <i>K</i><sub>d</sub> 數據,建立預測蛋白質-肽親和力的模型,並檢視鮮味肽與味覺受體的關係。結果顯示,鮮味肽對鮮味受體的親和力較強,但對苦味受體則無顯著差異。研究編制了972種鮮味肽和608種非鮮味肽的數據集,並開發出準確率達82%的預測模型,還創建了使用者友好的網站UmamiMeta,成為鮮味肽分析的資源。 PubMed DOI

這項研究提出了PKAN新架構,結合多模態表徵和語言模型概念,能更準確預測胜肽的活性與功能,表現優於現有方法。PKAN也有助於解析影響胜肽功能的關鍵特徵,推動生物學上胜肽語言模型的發展。 PubMed DOI

**重點摘要:** 深度學習已經徹底改變了蛋白質結構預測的領域,成功彌補了大量蛋白質序列與有限實驗決定結構之間的落差。這篇綜述整理了主要的資料庫、深度學習與大型語言模型在蛋白質結構預測上的最新進展,並討論了這個領域未來的挑戰與機會,特別強調其對藥物發現與開發的影響。 PubMed DOI

胜肽能自組裝成多功能材料,應用於生醫和奈米科技,但因序列多樣、實驗變異大,設計上很困難。機器學習有助於發現新型自組裝胜肽,但需高品質資料、專業知識,且要納入失敗案例。結合先進AI和可解釋分析,可加速胜肽奈米材料的研發。 PubMed DOI

作者提出一套新方法,結合半監督神經網路(Seq2Fitness)和創新最佳化演算法(BADASS),能更準確預測蛋白質適應度,並有效率產生多樣且高適應度的蛋白質序列。這方法比現有技術更省資源、效果更好,未來也有機會應用在 DNA、RNA 等其他生物序列上。 PubMed DOI