Unsupervised evolution of protein and antibody complexes with a structure-informed language model.
蛋白質和抗體複合物的無監督進化與結構資訊語言模型。 Science 2024-07-04

透過序列數據訓練的語言模型可學習蛋白質設計原則，但蛋白功能受結構影響。結合語言模型與結構資訊，可引導蛋白演化，改良抗SARS-CoV-2抗體，增強對病毒變異的中和能力。整合結構數據有助於找出有效蛋白演化路徑，無需特定訓練。 PubMed DOI

Integrating genetic algorithms and language models for enhanced enzyme design.
整合遺傳算法與語言模型以增強酶的設計。 Brief Bioinform 2025-01-09

這項研究提出了一個新框架，結合大型語言模型（LLMs）和遺傳演算法（GAs），用來優化酶的設計，解決蛋白質序列及功能的複雜挑戰。研究人員透過大量蛋白質序列數據，找出影響酶結構和功能的氨基酸關係，並利用遺傳演算法有效搜尋能提升催化性能的酶序列。測試結果顯示，生成的酶突變體在90%的案例中超越野生型酶，並維持相似的結構特徵，顯示這種方法的有效性，推進了生物催化劑設計的計算方法。 PubMed DOI

Improving functional protein generation via foundation model-derived latent space likelihood optimization.
透過基礎模型衍生的潛在空間似然優化來改善功能性蛋白質生成。 bioRxiv 2025-01-20

深度生成模型越來越常用於從零開始設計功能性蛋白質。雖然3D蛋白質設計是一種方法，但基於序列的生成方法因為擁有大量的蛋白質序列數據和較簡單的訓練需求而更受歡迎。這些模型專注於匹配訓練數據中的蛋白質序列，但不必每個氨基酸都完全一致，因為某些變異不影響功能。我們提出了一種新訓練方法，優化氨基酸序列和潛在空間中的訓練數據可能性，並在生成抗微生物肽和蘋果酸脫氫酶上測試，結果超越了多種其他深度生成模型，顯示出我們的方法在功能性蛋白質生成上的有效性。 PubMed DOI

AI-enabled alkaline-resistant evolution of protein to apply in mass production.
AI 驅動的耐鹼蛋白進化以應用於大規模生產。 Elife 2025-02-19

這項研究強調了先進的大型語言模型（LLM），特別是Pro-PRIME模型，在增強結合生長激素的VHH抗體的穩定性方面的成效。考慮到蛋白質常需在極端環境中運作，研究探討了設計更高穩定性和功能性蛋白質的挑戰。經過兩輪設計，成功產生了一種突變抗體，具備更好的熱穩定性、極端pH抵抗力及更強的結合親和力。這是LLM設計的蛋白質產品首次成功應用於大規模生產，顯示其在蛋白質工程上的潛力。 PubMed DOI

Teaching AI to speak protein.
教導人工智慧理解蛋白質語言。 Curr Opin Struct Biol 2025-02-22

蛋白質語言模型（pLMs）正逐漸成為理解蛋白質序列及其功能的重要工具，特別是在預測分子功能方面，如識別結合位點和評估基因變異影響。不過，單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM，可以提升其效率和準確性，尤其在實驗數據不足的情況下。總的來說，pLM為計算生物學與實驗生物學的整合鋪路，預示著蛋白質設計的新時代。 PubMed DOI

Language models for protein design.
蛋白質設計的語言模型。 Curr Opin Struct Biol 2025-03-07

這篇評論探討語言模型在蛋白質設計中的應用，將蛋白質視為氨基酸序列，類比於語言模型處理句子中的單詞。文章介紹蛋白質語言模型的基本概念，強調最近的進展，如上下文設計和結構信息整合，並討論目前的限制。此外，評論還建議未來的研究方向，以提升蛋白質語言模型，改善設計結果。 PubMed DOI

An expandable synthetic library of human paired antibody sequences.
可擴展的人類成對抗體序列合成庫 PLoS Comput Biol 2025-04-21

目前人類抗體序列的多樣性了解有限，因為現有檢測方法又貴又沒效率。作者開發了IgHuAb大型語言模型，能產生大量成對人類抗體序列，並建立了SynAbLib合成抗體庫，不只反映自然多樣性，還有更高變化。實驗證明，SynAbLib的抗體表現很好。這些工具提供一種可擴展的方法，能快速產生和搜尋理想人類抗體。 PubMed DOI

Prediction and design of thermostable proteins with a desired melting temperature.
具備特定熔解溫度之耐熱性蛋白質的預測與設計 Sci Rep 2025-05-14

這項研究開發出結合序列特徵和蛋白質語言模型的新機器學習方法，能準確預測蛋白質熔點溫度（Tm），預測與實際值的相關性高達0.89。他們也推出網頁伺服器和Python套件，方便研究人員預測及設計高熱穩定蛋白質，應用更廣泛。 PubMed DOI

A Survey of Pretrained Protein Language Models.
預訓練蛋白質語言模型之調查 Methods Mol Biol 2025-07-02

蛋白質語言模型（PLMs）受大型語言模型啟發，已大幅推動蛋白質生物資訊學發展，特別在分類、功能預測和新蛋白質設計上表現亮眼。本章介紹PLMs的發展、主要架構及新趨勢，強調這些技術對解決生物學難題越來越重要。 PubMed DOI

Large Context, Deeper Insights: Harnessing Large Language Models for Advancing Protein-Protein Interaction Analysis.
大語言模型於促進蛋白質-蛋白質交互作用分析之應用：大範疇背景，深入洞見 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對生物研究和新藥開發很關鍵。現在大型語言模型（LLMs）已能從蛋白質序列分析PPIs，處理大規模資料也沒問題。不過，還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化，讓LLMs在生物領域發揮更大作用。 PubMed DOI

原始文章

站上相關主題文章列表