Improving functional protein generation via foundation model-derived latent space likelihood optimization.
透過基礎模型衍生的潛在空間似然優化來改善功能性蛋白質生成。 bioRxiv 2025-01-20

深度生成模型越來越常用於從零開始設計功能性蛋白質。雖然3D蛋白質設計是一種方法，但基於序列的生成方法因為擁有大量的蛋白質序列數據和較簡單的訓練需求而更受歡迎。這些模型專注於匹配訓練數據中的蛋白質序列，但不必每個氨基酸都完全一致，因為某些變異不影響功能。我們提出了一種新訓練方法，優化氨基酸序列和潛在空間中的訓練數據可能性，並在生成抗微生物肽和蘋果酸脫氫酶上測試，結果超越了多種其他深度生成模型，顯示出我們的方法在功能性蛋白質生成上的有效性。 PubMed DOI

Using Large Language Model to Optimize Protein Purification: Insights from Protein Structure Literature Associated with Protein Data Bank.
利用大型語言模型優化蛋白質純化：來自與蛋白質數據庫相關的蛋白質結構文獻的見解。 Adv Sci (Weinh) 2025-02-20

我們開發了一個自動化工具，利用大型語言模型（LLM）來簡化從超過81,000篇與蛋白質資料庫（PDB）相關的文章中提取和分類蛋白質的表達及純化方法。這個工具能有效解決優化蛋白質樣本的挑戰，因為表達條件和純化策略的變化常常耗時。主要發現包括：Tris緩衝液最常用，聚組氨酸標籤佔主導，最佳表達溫度為16-20 °C，誘導時間偏好12-16小時。這個資源對研究人員設計蛋白質實驗非常有幫助。 PubMed DOI

Teaching AI to speak protein.
教導人工智慧理解蛋白質語言。 Curr Opin Struct Biol 2025-02-22

蛋白質語言模型（pLMs）正逐漸成為理解蛋白質序列及其功能的重要工具，特別是在預測分子功能方面，如識別結合位點和評估基因變異影響。不過，單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM，可以提升其效率和準確性，尤其在實驗數據不足的情況下。總的來說，pLM為計算生物學與實驗生物學的整合鋪路，預示著蛋白質設計的新時代。 PubMed DOI

Comparative Assessment of Protein Large Language Models for Enzyme Commission Number Prediction.
酶委員會編號預測的蛋白質大型語言模型比較評估。 BMC Bioinformatics 2025-02-27

這項研究評估了幾種蛋白質大型語言模型（LLMs），如ESM2、ESM1b和ProtBERT，在預測酶功能方面的表現，並與傳統的序列比對方法BLASTp進行比較。雖然BLASTp通常表現較佳，但LLMs，特別是結合全連接神經網絡時，超越了傳統的一熱編碼模型。ESM2被認為是最有效的LLM，尤其在挑戰性註釋任務中表現突出。研究顯示，LLMs雖未達到BLASTp的黃金標準，但在序列同一性低的情況下，能有效預測難以註釋的酶的EC編號，並強調兩者可互補，提升酶的註釋效果。 PubMed DOI

ProtFun: A Protein Function Prediction Model Using Graph Attention Networks with a Protein Large Language Model.
ProtFun：結合蛋白質大型語言模型與圖注意力網路的蛋白質功能預測模型 bioRxiv 2025-06-04

這篇研究提出 ProtFun 深度學習模型，結合蛋白質語言模型嵌入、家族網路資訊（用圖注意力網路）和蛋白質特徵，來預測蛋白質功能。實驗結果顯示 ProtFun 在標準資料集上表現比現有方法更好，程式碼也已經公開。 PubMed DOI

Translating a GO Term List to Human Readable Function Description Using GO2Sum.
使用 GO2Sum 將 GO term 清單轉換為人類可讀的功能描述 Methods Mol Biol 2025-07-02

**重點整理：** GO2Sum 是一個工具，利用語言模型把冗長的 Gene Ontology (GO) 詞彙清單，轉換成簡短、易讀的蛋白質功能、結構和路徑摘要，讓生物學家更容易解讀蛋白質功能的預測結果。這個工具有提供一個操作簡單的網頁伺服器可以使用。 PubMed DOI

TransFun: A Tool of Integrating Large Language Models, Transformers, and Equivariant Graph Neural Networks to Predict Protein Function.
TransFun：結合大型語言模型、Transformers 與等變圖神經網路以預測蛋白質功能的工具 Methods Mol Biol 2025-07-02

用實驗鑑定蛋白質功能很慢又困難，導致很多蛋白質雖然知道序列和結構，功能還是不清楚。自動化功能預測（AFP）用電腦方法，結合序列、結構等資料來預測功能。本章介紹 TransFun，利用蛋白質語言模型和 AlphaFold 結構，提升預測準確度。程式碼在 https://github.com/jianlin-cheng/TransFun。 PubMed DOI

A Survey of Biological Function Prediction Methods with Focus on Natural Language Processing (NLP) and Large Language Models (LLM).
聚焦於自然語言處理（NLP）與大型語言模型（LLM）的生物功能預測方法綜述 Methods Mol Biol 2025-07-02

**重點摘要：** 這份調查回顧了目前用來預測蛋白質功能的模型，特別著重於運用自然語言處理（NLP）和大型語言模型（LLMs）來分析蛋白質序列和科學文獻的相關方法。內容強調了近期在自動化蛋白質功能註解（從序列資料和已發表研究中）方面的進展，以及目前仍面臨的挑戰。 PubMed DOI

Large Context, Deeper Insights: Harnessing Large Language Models for Advancing Protein-Protein Interaction Analysis.
大語言模型於促進蛋白質-蛋白質交互作用分析之應用：大範疇背景，深入洞見 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對生物研究和新藥開發很關鍵。現在大型語言模型（LLMs）已能從蛋白質序列分析PPIs，處理大規模資料也沒問題。不過，還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化，讓LLMs在生物領域發揮更大作用。 PubMed DOI

Large Language Model (LLM)-Based Advances in Prediction of Post-translational Modification Sites in Proteins.
基於大型語言模型（LLM）在蛋白質翻譯後修飾位點預測上的新進展 Methods Mol Biol 2025-07-02

本章介紹用蛋白質語言模型（pLMs）預測蛋白質翻譯後修飾（PTM）位點的最新進展，強調pLMs能提升預測準確度。內容也提到微調、多模態整合、新型架構等趨勢，並討論模型可解釋性、現有限制及未來發展方向。 PubMed DOI

原始文章

站上相關主題文章列表