原始文章

這項研究探討了先進計算方法在蛋白質骨架設計與修改上的創新應用,對於蛋白質功能及疾病治療影響重大。研究團隊開發了名為PB-GPT的模型,透過代碼本量化和壓縮字典,將蛋白質骨架結構轉換為獨特編碼格式。該模型在多個數據集上訓練與評估,顯示出生成複雜且真實蛋白質骨架的能力,模仿自然蛋白質結構,顯示大型語言模型在蛋白質結構設計上的潛力。 PubMed DOI


站上相關主題文章列表

ProGen是一個深度學習模型,可以像製造句子一樣,生成具有特定功能的蛋白質序列。透過大量蛋白質數據訓練後,ProGen可以微調,提升生成目標蛋白質的能力。這個模型可以創造人工蛋白質,效率與天然蛋白質相當,即使序列不同。適用於不同蛋白質家族,如輔酶A轉移酶和丙酮酸脫氫酶。 PubMed DOI

設計新型蛋白質對生物醫學領域至關重要。一種新方法利用統計模型,受自然語言處理啟發,用於設計氨基酸序列。這方法專注於生成蛋白質結構域序列,而非單一蛋白質。通過將問題視為結構域間翻譯,模型可生成配對序列。經評估發現,此方法優於現有策略,並探討了預訓練語言模型和Alphafold 2的應用。更多資訊可於GitHub取得。 PubMed DOI

近年來,專注於訓練圖像和語言的大型架構有了很大的進展,對電腦視覺和自然語言處理產生了深遠的影響。像ChatGPT和GPT-4等最新語言模型展現出卓越處理人類語言的能力。這些進步也影響了蛋白質研究,推動新方法快速發展,展現出優異表現。部分模型致力於生成未被探索的蛋白質區域序列。本文概述了蛋白質生成模型的應用,包括語言模型用於人工蛋白質設計、非Transformer架構以及應用於定向進化方法。 PubMed DOI

AbGAN-LMG是一種新型生成對抗網路,利用語言模型改進高品質抗體的生成。研究指出AbGAN-LMG在COVID-19和MERS-CoV抗體上的應用,提升生成序列的多樣性和品質。對抗體AZD-8895的研究發現,超過50%的生成序列具有更佳性質。分子對接確認了70種抗體對SARS-CoV-2 RBD的親和力高於AZD-8895。AbGAN-LMG結合語言模型與GANs,提升抗體優化效率。詳情請見:http://39.102.71.224:88/。 PubMed DOI

最新的語言模型對蛋白質研究有重大影響,特別是GPT-4等模型展現出潛力,可應用在蛋白質領域。蛋白質語言模型已顯示出預測和創新蛋白質的能力,並取得重要進展。本文討論了這個新興領域的機會和挑戰,並提供了LLMs對蛋白質研究的影響。 PubMed DOI

AI技術如GPT-4在生物學領域展現潛力,可生成氨基酸、多肽鏈的3D結構,並分析藥物與靶蛋白的互動。儘管有時會出現錯誤,但AI成功辨識關鍵氨基酸殘基。這研究顯示AI在生物學模擬和分子互動分析上的應用前景。 PubMed DOI

蛋白質在藥物研發中扮演重要角色,但傳統方法太貴又太慢。研究引入了一個快速又精確的分類器,使用了帶有ESM-2嵌入的蛋白質語言模型(PLM),準確率達95.11%。比較結果顯示,ESM-2嵌入比PSSM特徵更優。同時,開發了基於GPT-2的端對端模型,將大型語言模型成功應用在蛋白質辨識上,並經Pharos數據集驗證表現。 PubMed DOI

了解基因、疾病和藥物對藥物開發很重要。研究指出,基於BERT的模型在識別蛋白質-蛋白質相互作用(PPIs)方面表現最佳,BioBERT召回率和F1分數最高,PubMedBERT精確度最高。即使沒有生物醫學背景,GPT-4也表現優秀。這些結果顯示GPT模型在檢測PPIs上有應用價值,值得進一步研究微調以應用於生物醫學任務。 PubMed DOI

提議的PALM-H3模型旨在簡化抗體設計,專注於生成針對特定抗原的人工抗體,特別是重鏈互補決定區域3(CDRH3),減少了從血清中分離天然抗體的需求,節省資源和時間。此外,A2binder模型可預測抗原與抗體的結合特異性。PALM-H3生成的抗體對SARS-CoV-2抗原,包括XBB變異株,顯示出高結合親和力和強中和能力。透過Roformer架構的注意力機制,增強了模型的可解釋性,為抗體設計提供了重要見解,代表抗體工程的一大進展。 PubMed DOI

這項研究探討了GPT-4在基本結構生物學任務上的表現。研究人員讓GPT-4創建20種氨基酸和一條α-螺旋多肽的3D模型,並用Wolfram進行數學計算。他們還分析了抗病毒藥物nirmatrelvir與SARS-CoV-2主要蛋白酶的結構互動。結果顯示,生成的結構大多與實驗數據一致,雖然在某些複雜分子上會有錯誤。總體來看,GPT-4在結構生物學建模和原子尺度互動分析上仍具有效性,儘管有些限制。 PubMed DOI