TPepRet: a deep learning model for characterizing T cell receptors-antigen binding patterns.
TPepRet：一個用於表徵 T 細胞受體-抗原結合模式的深度學習模型。 Bioinformatics 2025-01-29

TPepRet是一個新型模型，旨在深入了解T細胞受體（TCR）與肽的相互作用，對癌症免疫療法、疫苗開發及自體免疫疾病管理非常重要。與現有工具不同，TPepRet考量了序列數據的方向性語義，提升了TCR-肽結合的準確性。它使用雙向門控遞歸單元（BiGRU）網絡來捕捉序列依賴性，並整合大型語言模型進行全面分析。經過嚴格評估，TPepRet的表現超越其他工具，成為理解臨床TCR-肽相互作用的重要資源。源代碼可在GitHub上找到，補充數據則在Bioinformatics上提供。 PubMed DOI

Leveraging protein language models for robust antimicrobial peptide detection.
利用蛋白質語言模型進行穩健的抗微生物肽檢測。 Methods 2025-03-06

抗微生物肽（AMPs）因其強大的抗微生物能力，正成為對抗抗生素抗藥性的新解決方案。傳統的AMP識別方法耗時且需大量人力，但隨著深度學習的進步，特別是蛋白質語言模型（PLMs），我們開發了PLAPD框架，利用預訓練的ESM2模型進行AMP分類。經過評估，PLAPD在準確率、精確率、特異性等指標上表現優異，顯示其作為高效AMP發現工具的潛力。 PubMed DOI

Learning the rules of peptide self-assembly through data mining with large language models.
透過大型語言模型的數據挖掘學習肽自組裝的規則。 Sci Adv 2025-03-26

這項研究聚焦於肽的自組裝，肽是形成多種結構的重要生物分子。雖然過去的研究探討了化學成分和外部條件對自組裝的影響，但缺乏全面的分析。為了解決這個問題，作者建立了一個肽組裝資料庫，結合專家整理和大型語言模型進行文獻挖掘，編輯了超過1000個實驗條目，詳細記錄肽的序列和條件。開發的機器學習模型達到超過80%的準確率，並微調了GPT模型以提升文獻挖掘的表現，進一步理解肽自組裝的機制。 PubMed DOI

A Comprehensive Review of Computational Methods for Protein-DNA Binding Site Prediction.
蛋白質-DNA 結合位點預測的計算方法綜述。 Anal Biochem 2025-04-10

這項研究強調準確識別蛋白質-DNA結合位點的重要性，對理解生物過程和推進藥物發現至關重要。傳統生化方法雖然是金標準，但因耗時耗資而不實用，因此需要高效的計算方法來預測這些位點。文章將計算方法分為三類：模板檢測、統計機器學習和深度學習，並用136個非冗餘蛋白質的基準評估14個預測模型。結果顯示，深度學習方法，特別是利用預訓練大型語言模型的，準確性最佳。此外，研究還探討了這些預測方法在生物研究和藥物設計中的應用潛力。 PubMed DOI

PKAN: Leveraging Kolmogorov-Arnold Networks and Multi-modal Learning for Peptide Prediction with Advanced Language Models.
PKAN：結合 Kolmogorov-Arnold 網路與多模態學習，搭配先進語言模型進行胜肽預測 IEEE J Biomed Health Inform 2025-04-17

這項研究提出了PKAN新架構，結合多模態表徵和語言模型概念，能更準確預測胜肽的活性與功能，表現優於現有方法。PKAN也有助於解析影響胜肽功能的關鍵特徵，推動生物學上胜肽語言模型的發展。 PubMed DOI

NeuroScale: evolutional scale-based protein language models enable prediction of neuropeptides.
NeuroScale：基於演化尺度的蛋白質語言模型促進神經肽的預測 BMC Biol 2025-05-28

NeuroScale 是新一代深度學習模型，結合演化蛋白質建模和多尺度神經網路（GoogLeNet），能精準預測神經肽（AUC 超過 0.97），不論序列相似度或長度都很穩定，非常適合用來發現神經肽和開發肽類藥物。 PubMed DOI

Using Machine Learning to Fast-Track Peptide Nanomaterial Discovery.
運用機器學習加速胜肽奈米材料的發現 ACS Nano 2025-05-29

胜肽能自組裝成多功能材料，應用於生醫和奈米科技，但因序列多樣、實驗變異大，設計上很困難。機器學習有助於發現新型自組裝胜肽，但需高品質資料、專業知識，且要納入失敗案例。結合先進AI和可解釋分析，可加速胜肽奈米材料的研發。 PubMed DOI

Designing diverse and high-performance proteins with a large language model in the loop.
結合大型語言模型設計多樣且高效能的蛋白質 PLoS Comput Biol 2025-06-05

作者提出一套新方法，結合半監督神經網路（Seq2Fitness）和創新最佳化演算法（BADASS），能更準確預測蛋白質適應度，並有效率產生多樣且高適應度的蛋白質序列。這方法比現有技術更省資源、效果更好，未來也有機會應用在 DNA、RNA 等其他生物序列上。 PubMed DOI

Large Context, Deeper Insights: Harnessing Large Language Models for Advancing Protein-Protein Interaction Analysis.
大語言模型於促進蛋白質-蛋白質交互作用分析之應用：大範疇背景，深入洞見 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對生物研究和新藥開發很關鍵。現在大型語言模型（LLMs）已能從蛋白質序列分析PPIs，處理大規模資料也沒問題。不過，還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化，讓LLMs在生物領域發揮更大作用。 PubMed DOI

Predicting Peptide Bioactivity Using the Unified Model Architecture UniDL4BioPep.
使用統一模型架構 UniDL4BioPep 預測胜肽生物活性 Methods Mol Biol 2025-07-02

UniDL4BioPep 是一套簡單好上手的機器學習工具，專門幫忙找生物活性胜肽。它用先進的蛋白質語言模型（像 ESM），大幅減少模型開發的難度和時間。就算是做濕實驗的研究人員，也能一鍵快速建立、客製化預測模型，特別適合做二元分類。本章會介紹它的技術細節和實際用法。 PubMed DOI

原始文章

站上相關主題文章列表