Unsupervised evolution of protein and antibody complexes with a structure-informed language model.
蛋白質和抗體複合物的無監督進化與結構資訊語言模型。 Science 2024-07-04

透過序列數據訓練的語言模型可學習蛋白質設計原則，但蛋白功能受結構影響。結合語言模型與結構資訊，可引導蛋白演化，改良抗SARS-CoV-2抗體，增強對病毒變異的中和能力。整合結構數據有助於找出有效蛋白演化路徑，無需特定訓練。 PubMed DOI

AI-enabled alkaline-resistant evolution of protein to apply in mass production.
AI 驅動的耐鹼蛋白進化以應用於大規模生產。 Elife 2025-02-19

這項研究強調了先進的大型語言模型（LLM），特別是Pro-PRIME模型，在增強結合生長激素的VHH抗體的穩定性方面的成效。考慮到蛋白質常需在極端環境中運作，研究探討了設計更高穩定性和功能性蛋白質的挑戰。經過兩輪設計，成功產生了一種突變抗體，具備更好的熱穩定性、極端pH抵抗力及更強的結合親和力。這是LLM設計的蛋白質產品首次成功應用於大規模生產，顯示其在蛋白質工程上的潛力。 PubMed DOI

Teaching AI to speak protein.
教導人工智慧理解蛋白質語言。 Curr Opin Struct Biol 2025-02-22

蛋白質語言模型（pLMs）正逐漸成為理解蛋白質序列及其功能的重要工具，特別是在預測分子功能方面，如識別結合位點和評估基因變異影響。不過，單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM，可以提升其效率和準確性，尤其在實驗數據不足的情況下。總的來說，pLM為計算生物學與實驗生物學的整合鋪路，預示著蛋白質設計的新時代。 PubMed DOI

Leveraging protein language models for robust antimicrobial peptide detection.
利用蛋白質語言模型進行穩健的抗微生物肽檢測。 Methods 2025-03-06

抗微生物肽（AMPs）因其強大的抗微生物能力，正成為對抗抗生素抗藥性的新解決方案。傳統的AMP識別方法耗時且需大量人力，但隨著深度學習的進步，特別是蛋白質語言模型（PLMs），我們開發了PLAPD框架，利用預訓練的ESM2模型進行AMP分類。經過評估，PLAPD在準確率、精確率、特異性等指標上表現優異，顯示其作為高效AMP發現工具的潛力。 PubMed DOI

Language models for protein design.
蛋白質設計的語言模型。 Curr Opin Struct Biol 2025-03-07

這篇評論探討語言模型在蛋白質設計中的應用，將蛋白質視為氨基酸序列，類比於語言模型處理句子中的單詞。文章介紹蛋白質語言模型的基本概念，強調最近的進展，如上下文設計和結構信息整合，並討論目前的限制。此外，評論還建議未來的研究方向，以提升蛋白質語言模型，改善設計結果。 PubMed DOI

Designing diverse and high-performance proteins with a large language model in the loop.
結合大型語言模型設計多樣且高效能的蛋白質 PLoS Comput Biol 2025-06-05

作者提出一套新方法，結合半監督神經網路（Seq2Fitness）和創新最佳化演算法（BADASS），能更準確預測蛋白質適應度，並有效率產生多樣且高適應度的蛋白質序列。這方法比現有技術更省資源、效果更好，未來也有機會應用在 DNA、RNA 等其他生物序列上。 PubMed DOI

Aligning large language models and geometric deep models for protein representation.
大型語言模型與幾何深度模型在蛋白質表徵上的對齊 Patterns (N Y) 2025-06-09

這篇研究發現，結合圖形和3D結構資料的蛋白質幾何深度模型（GDMs）能和大型語言模型（LLMs）更好對齊，且LLMs規模越大效果越好。罕見蛋白質較難對齊，但提升GDM嵌入維度、用兩層投影頭、或針對蛋白質微調LLM都能改善。對齊提升後，下游任務表現更好，也能減少模型產生錯誤資訊。 PubMed DOI

A Survey of Pretrained Protein Language Models.
預訓練蛋白質語言模型之調查 Methods Mol Biol 2025-07-02

蛋白質語言模型（PLMs）受大型語言模型啟發，已大幅推動蛋白質生物資訊學發展，特別在分類、功能預測和新蛋白質設計上表現亮眼。本章介紹PLMs的發展、主要架構及新趨勢，強調這些技術對解決生物學難題越來越重要。 PubMed DOI

Large Context, Deeper Insights: Harnessing Large Language Models for Advancing Protein-Protein Interaction Analysis.
大語言模型於促進蛋白質-蛋白質交互作用分析之應用：大範疇背景，深入洞見 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對生物研究和新藥開發很關鍵。現在大型語言模型（LLMs）已能從蛋白質序列分析PPIs，處理大規模資料也沒問題。不過，還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化，讓LLMs在生物領域發揮更大作用。 PubMed DOI

Protein2Text: Resampling Mechanism to Translate Protein Sequences into Human-Interpretable Text.
Protein2Text：將蛋白質序列轉換為人類可解讀文本的重取樣機制 Proc Conf 2025-07-23

Protein2Text 是一款能讀懂蛋白質序列並用文字回答相關問題的多模態大型語言模型。它改良 LLaVA 架構並加入重取樣機制，讓蛋白質序列更適合語言處理。經過 PubMed 資料集訓練，在多項測試中表現優於現有模型。研究也提醒現有評估方式有缺陷，呼籲改進。模型資源已全數開放。 PubMed DOI

原始文章

站上相關主題文章列表