Large language models generate functional protein sequences across diverse families.
大型語言模型在各種家族中生成功能性蛋白質序列。 Nat Biotechnol 2023-10-03

ProGen是一個深度學習模型，可以像製造句子一樣，生成具有特定功能的蛋白質序列。透過大量蛋白質數據訓練後，ProGen可以微調，提升生成目標蛋白質的能力。這個模型可以創造人工蛋白質，效率與天然蛋白質相當，即使序列不同。適用於不同蛋白質家族，如輔酶A轉移酶和丙酮酸脫氫酶。 PubMed DOI

Generating interacting protein sequences using domain-to-domain translation.
利用區域對區域轉譯生成交互蛋白序列。 Bioinformatics 2023-07-18

設計新型蛋白質對生物醫學領域至關重要。一種新方法利用統計模型，受自然語言處理啟發，用於設計氨基酸序列。這方法專注於生成蛋白質結構域序列，而非單一蛋白質。通過將問題視為結構域間翻譯，模型可生成配對序列。經評估發現，此方法優於現有策略，並探討了預訓練語言模型和Alphafold 2的應用。更多資訊可於GitHub取得。 PubMed DOI

Exploring the Protein Sequence Space with Global Generative Models.
使用全球生成模型探索蛋白質序列空間。 Cold Spring Harb Perspect Biol 2023-11-08

近年來，專注於訓練圖像和語言的大型架構有了很大的進展，對電腦視覺和自然語言處理產生了深遠的影響。像ChatGPT和GPT-4等最新語言模型展現出卓越處理人類語言的能力。這些進步也影響了蛋白質研究，推動新方法快速發展，展現出優異表現。部分模型致力於生成未被探索的蛋白質區域序列。本文概述了蛋白質生成模型的應用，包括語言模型用於人工蛋白質設計、非Transformer架構以及應用於定向進化方法。 PubMed DOI

Improving antibody optimization ability of generative adversarial network through large language model.
透過大型語言模型提升生成對抗網絡的抗體優化能力。 Comput Struct Biotechnol J 2023-12-11

AbGAN-LMG是一種新型生成對抗網路，利用語言模型改進高品質抗體的生成。研究指出AbGAN-LMG在COVID-19和MERS-CoV抗體上的應用，提升生成序列的多樣性和品質。對抗體AZD-8895的研究發現，超過50%的生成序列具有更佳性質。分子對接確認了70種抗體對SARS-CoV-2 RBD的親和力高於AZD-8895。AbGAN-LMG結合語言模型與GANs，提升抗體優化效率。詳情請見：http://39.102.71.224:88/。 PubMed DOI

The promises of large language models for protein design and modeling.
大型語言模型在蛋白質設計和建模中的潛力。 Front Bioinform 2023-12-11

最新的語言模型對蛋白質研究有重大影響，特別是GPT-4等模型展現出潛力，可應用在蛋白質領域。蛋白質語言模型已顯示出預測和創新蛋白質的能力，並取得重要進展。本文討論了這個新興領域的機會和挑戰，並提供了LLMs對蛋白質研究的影響。 PubMed DOI

Generative artificial intelligence performs rudimentary structural biology modeling.
生成人工智慧執行基本的結構生物學建模。 bioRxiv 2024-03-11

AI技術如GPT-4在生物學領域展現潛力，可生成氨基酸、多肽鏈的3D結構，並分析藥物與靶蛋白的互動。儘管有時會出現錯誤，但AI成功辨識關鍵氨基酸殘基。這研究顯示AI在生物學模擬和分子互動分析上的應用前景。 PubMed DOI

Comprehensive Research on Druggable Proteins: From PSSM to Pre-Trained Language Models.
從PSSM到預訓練語言模型：可藥物靶蛋白的全面研究。 Int J Mol Sci 2024-04-27

蛋白質在藥物研發中扮演重要角色，但傳統方法太貴又太慢。研究引入了一個快速又精確的分類器，使用了帶有ESM-2嵌入的蛋白質語言模型（PLM），準確率達95.11%。比較結果顯示，ESM-2嵌入比PSSM特徵更優。同時，開發了基於GPT-2的端對端模型，將大型語言模型成功應用在蛋白質辨識上，並經Pharos數據集驗證表現。 PubMed DOI

Evaluation of GPT and BERT-based models on identifying protein-protein interactions in biomedical text.
在生物醫學文本中評估 GPT 和基於 BERT 模型識別蛋白質相互作用。 ArXiv 2024-05-20

了解基因、疾病和藥物對藥物開發很重要。研究指出，基於BERT的模型在識別蛋白質-蛋白質相互作用（PPIs）方面表現最佳，BioBERT召回率和F1分數最高，PubMedBERT精確度最高。即使沒有生物醫學背景，GPT-4也表現優秀。這些結果顯示GPT模型在檢測PPIs上有應用價值，值得進一步研究微調以應用於生物醫學任務。 PubMed DOI

De novo generation of SARS-CoV-2 antibody CDRH3 with a pre-trained generative large language model.
利用預訓練的生成大型語言模型進行 SARS-CoV-2 抗體 CDRH3 的去新生產。 Nat Commun 2024-08-10

提議的PALM-H3模型旨在簡化抗體設計，專注於生成針對特定抗原的人工抗體，特別是重鏈互補決定區域3（CDRH3），減少了從血清中分離天然抗體的需求，節省資源和時間。此外，A2binder模型可預測抗原與抗體的結合特異性。PALM-H3生成的抗體對SARS-CoV-2抗原，包括XBB變異株，顯示出高結合親和力和強中和能力。透過Roformer架構的注意力機制，增強了模型的可解釋性，為抗體設計提供了重要見解，代表抗體工程的一大進展。 PubMed DOI

Generative artificial intelligence performs rudimentary structural biology modeling.
生成式人工智慧執行基本的結構生物學建模。 Sci Rep 2024-08-21

這項研究探討了GPT-4在基本結構生物學任務上的表現。研究人員讓GPT-4創建20種氨基酸和一條α-螺旋多肽的3D模型，並用Wolfram進行數學計算。他們還分析了抗病毒藥物nirmatrelvir與SARS-CoV-2主要蛋白酶的結構互動。結果顯示，生成的結構大多與實驗數據一致，雖然在某些複雜分子上會有錯誤。總體來看，GPT-4在結構生物學建模和原子尺度互動分析上仍具有效性，儘管有些限制。 PubMed DOI

原始文章

站上相關主題文章列表