Teaching AI to speak protein.
教導人工智慧理解蛋白質語言。 Curr Opin Struct Biol 2025-02-22

蛋白質語言模型（pLMs）正逐漸成為理解蛋白質序列及其功能的重要工具，特別是在預測分子功能方面，如識別結合位點和評估基因變異影響。不過，單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM，可以提升其效率和準確性，尤其在實驗數據不足的情況下。總的來說，pLM為計算生物學與實驗生物學的整合鋪路，預示著蛋白質設計的新時代。 PubMed DOI

PKAN: Leveraging Kolmogorov-Arnold Networks and Multi-modal Learning for Peptide Prediction with Advanced Language Models.
PKAN：結合 Kolmogorov-Arnold 網路與多模態學習，搭配先進語言模型進行胜肽預測 IEEE J Biomed Health Inform 2025-04-17

這項研究提出了PKAN新架構，結合多模態表徵和語言模型概念，能更準確預測胜肽的活性與功能，表現優於現有方法。PKAN也有助於解析影響胜肽功能的關鍵特徵，推動生物學上胜肽語言模型的發展。 PubMed DOI

Protein structure prediction via deep learning: an in-depth review.
深度學習於蛋白質結構預測之深入綜述 Front Pharmacol 2025-04-18

**重點摘要：** 深度學習已經徹底改變了蛋白質結構預測的領域，成功彌補了大量蛋白質序列與有限實驗決定結構之間的落差。這篇綜述整理了主要的資料庫、深度學習與大型語言模型在蛋白質結構預測上的最新進展，並討論了這個領域未來的挑戰與機會，特別強調其對藥物發現與開發的影響。 PubMed DOI

Designing diverse and high-performance proteins with a large language model in the loop.
結合大型語言模型設計多樣且高效能的蛋白質 PLoS Comput Biol 2025-06-05

作者提出一套新方法，結合半監督神經網路（Seq2Fitness）和創新最佳化演算法（BADASS），能更準確預測蛋白質適應度，並有效率產生多樣且高適應度的蛋白質序列。這方法比現有技術更省資源、效果更好，未來也有機會應用在 DNA、RNA 等其他生物序列上。 PubMed DOI

A Survey of Pretrained Protein Language Models.
預訓練蛋白質語言模型之調查 Methods Mol Biol 2025-07-02

蛋白質語言模型（PLMs）受大型語言模型啟發，已大幅推動蛋白質生物資訊學發展，特別在分類、功能預測和新蛋白質設計上表現亮眼。本章介紹PLMs的發展、主要架構及新趨勢，強調這些技術對解決生物學難題越來越重要。 PubMed DOI

Ranking Protein-Protein Models with Large Language Models and Graph Neural Networks.
結合大型語言模型與圖神經網路對蛋白質-蛋白質模型進行排序 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對疾病研究和藥物開發很重要，但從眾多模擬結構中挑出最準確的很困難。DeepRank-GNN-esm 是一款深度學習工具，結合圖形化方法和蛋白質語言模型，能有效排序並選出最佳PPI模型。詳細教學和工具下載可參考 https://github.com/haddocking/DeepRank-GNN-esm。 PubMed DOI

TransFun: A Tool of Integrating Large Language Models, Transformers, and Equivariant Graph Neural Networks to Predict Protein Function.
TransFun：結合大型語言模型、Transformers 與等變圖神經網路以預測蛋白質功能的工具 Methods Mol Biol 2025-07-02

用實驗鑑定蛋白質功能很慢又困難，導致很多蛋白質雖然知道序列和結構，功能還是不清楚。自動化功能預測（AFP）用電腦方法，結合序列、結構等資料來預測功能。本章介紹 TransFun，利用蛋白質語言模型和 AlphaFold 結構，提升預測準確度。程式碼在 https://github.com/jianlin-cheng/TransFun。 PubMed DOI

Using InterLabelGO+ for Accurate Protein Language Model-Based Function Prediction.
使用 InterLabelGO+ 進行精確的蛋白質語言模型功能預測 Methods Mol Biol 2025-07-02

InterLabelGO+ 是一款在 CAFA5 表現很好的深度學習工具，用來預測蛋白質功能（GO terms）。它用 ESM2 模型抓序列特徵，並考慮 GO terms 間的關聯。這套工具結合深度學習和同源性分析，提升預測準確度。可透過網頁或安裝套件使用，也支援用戶自行用新資料訓練模型。 PubMed DOI

A Survey of Biological Function Prediction Methods with Focus on Natural Language Processing (NLP) and Large Language Models (LLM).
聚焦於自然語言處理（NLP）與大型語言模型（LLM）的生物功能預測方法綜述 Methods Mol Biol 2025-07-02

**重點摘要：** 這份調查回顧了目前用來預測蛋白質功能的模型，特別著重於運用自然語言處理（NLP）和大型語言模型（LLMs）來分析蛋白質序列和科學文獻的相關方法。內容強調了近期在自動化蛋白質功能註解（從序列資料和已發表研究中）方面的進展，以及目前仍面臨的挑戰。 PubMed DOI

Large Context, Deeper Insights: Harnessing Large Language Models for Advancing Protein-Protein Interaction Analysis.
大語言模型於促進蛋白質-蛋白質交互作用分析之應用：大範疇背景，深入洞見 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對生物研究和新藥開發很關鍵。現在大型語言模型（LLMs）已能從蛋白質序列分析PPIs，處理大規模資料也沒問題。不過，還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化，讓LLMs在生物領域發揮更大作用。 PubMed DOI

原始文章

站上相關主題文章列表