Becoming fluent in proteins.
成為蛋白質的流利者。 Cell Syst 2024-01-30

像ProGen2和IgLM這樣的大型語言模型正被應用在蛋白工程領域，以更有效地設計蛋白質。 PubMed DOI

Inverse folding of protein complexes with a structure-informed language model enables unsupervised antibody evolution.
利用結構資訊語言模型進行蛋白質複合物的反向折疊，實現無監督抗體進化。 bioRxiv 2024-02-10

透過大型語言模型訓練，結合蛋白結構資訊，可以引導蛋白演化，提升功能。這種策略非監督式學習，能夠優化蛋白結構，增強功能。研究已成功應用於提升對抗SARS-CoV-2的抗體效力，改善對病毒變異體的中和和親和力。逆向折疊方法優於其他機器學習引導的進化方式，成功率高，且無需特定訓練數據。 PubMed DOI

Unsupervised evolution of protein and antibody complexes with a structure-informed language model.
蛋白質和抗體複合物的無監督進化與結構資訊語言模型。 Science 2024-07-04

透過序列數據訓練的語言模型可學習蛋白質設計原則，但蛋白功能受結構影響。結合語言模型與結構資訊，可引導蛋白演化，改良抗SARS-CoV-2抗體，增強對病毒變異的中和能力。整合結構數據有助於找出有效蛋白演化路徑，無需特定訓練。 PubMed DOI

ProtAgents: protein discovery <i>via</i> large language model multi-agent collaborations combining physics and machine learning.
ProtAgents: 透過結合物理學與機器學習的大型語言模型多智能體協作，進行蛋白質發現。 Digit Discov 2024-07-12

介紹了ProtAgents，一個利用大型語言模型設計新蛋白質的平台。多個人工智慧代理人合作應對複雜任務，擁有多樣能力。透過LLMs驅動的代理人合作，提供多功能蛋白質設計和分析方法。系統可設計新蛋白質、分析結構，並模擬振動頻率。自動化和協同方法可設計具特定機械性能的蛋白質，釋放解決多目標材料問題的潛力，為自主材料發現和設計鋪平道路。 PubMed DOI

De novo generation of SARS-CoV-2 antibody CDRH3 with a pre-trained generative large language model.
利用預訓練的生成大型語言模型進行 SARS-CoV-2 抗體 CDRH3 的去新生產。 Nat Commun 2024-08-10

提議的PALM-H3模型旨在簡化抗體設計，專注於生成針對特定抗原的人工抗體，特別是重鏈互補決定區域3（CDRH3），減少了從血清中分離天然抗體的需求，節省資源和時間。此外，A2binder模型可預測抗原與抗體的結合特異性。PALM-H3生成的抗體對SARS-CoV-2抗原，包括XBB變異株，顯示出高結合親和力和強中和能力。透過Roformer架構的注意力機制，增強了模型的可解釋性，為抗體設計提供了重要見解，代表抗體工程的一大進展。 PubMed DOI

Approaching Optimal pH Enzyme Prediction with Large Language Models.
利用大型語言模型接近最佳 pH 酶預測。 ACS Synth Biol 2024-08-28

酵素在生物技術中非常重要，應用於食品、洗衣、製藥等領域，因為它們能催化化學反應。酵素的活性受pH值影響，每種酵素在特定pH範圍內表現最佳。為了解決這個挑戰，我們開發了一種基於語言模型的方法，預測酵素序列的最佳pH範圍。透過多種切分策略，我們的機器學習模型在不同蛋白質家族中展現高準確性，能快速識別具有理想pH的酵素，促進高通量探索。 PubMed DOI

Integrating genetic algorithms and language models for enhanced enzyme design.
整合遺傳算法與語言模型以增強酶的設計。 Brief Bioinform 2025-01-09

這項研究提出了一個新框架，結合大型語言模型（LLMs）和遺傳演算法（GAs），用來優化酶的設計，解決蛋白質序列及功能的複雜挑戰。研究人員透過大量蛋白質序列數據，找出影響酶結構和功能的氨基酸關係，並利用遺傳演算法有效搜尋能提升催化性能的酶序列。測試結果顯示，生成的酶突變體在90%的案例中超越野生型酶，並維持相似的結構特徵，顯示這種方法的有效性，推進了生物催化劑設計的計算方法。 PubMed DOI

Improving functional protein generation via foundation model-derived latent space likelihood optimization.
透過基礎模型衍生的潛在空間似然優化來改善功能性蛋白質生成。 bioRxiv 2025-01-20

深度生成模型越來越常用於從零開始設計功能性蛋白質。雖然3D蛋白質設計是一種方法，但基於序列的生成方法因為擁有大量的蛋白質序列數據和較簡單的訓練需求而更受歡迎。這些模型專注於匹配訓練數據中的蛋白質序列，但不必每個氨基酸都完全一致，因為某些變異不影響功能。我們提出了一種新訓練方法，優化氨基酸序列和潛在空間中的訓練數據可能性，並在生成抗微生物肽和蘋果酸脫氫酶上測試，結果超越了多種其他深度生成模型，顯示出我們的方法在功能性蛋白質生成上的有效性。 PubMed DOI

Teaching AI to speak protein.
教導人工智慧理解蛋白質語言。 Curr Opin Struct Biol 2025-02-22

蛋白質語言模型（pLMs）正逐漸成為理解蛋白質序列及其功能的重要工具，特別是在預測分子功能方面，如識別結合位點和評估基因變異影響。不過，單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM，可以提升其效率和準確性，尤其在實驗數據不足的情況下。總的來說，pLM為計算生物學與實驗生物學的整合鋪路，預示著蛋白質設計的新時代。 PubMed DOI

Generation of antigen-specific paired chain antibody sequences using large language models.
利用大型語言模型生成抗原特異性配對鏈抗體序列。 bioRxiv 2025-03-03

傳統抗體發現方法效率低、成本高且成功率不佳。為了解決這些問題，最近引入了人工智慧（AI）技術來增強和創造新的抗體序列。本研究介紹了MAGE（單克隆抗體生成器），這是一種專門設計的蛋白質語言模型，能生成針對不同目標的人類抗體序列。MAGE已成功產生新穎且多樣的抗體，並在實驗中證實其對SARS-CoV-2、禽流感H5N1和RSV-A的結合特異性，成為針對多目標抗體設計的先驅工具。 PubMed DOI

原始文章

站上相關主題文章列表