原始文章

這項研究專注於預測蛋白質表面的疏水性區域,對於蛋白質的相互作用及聚集性疾病非常重要。研究人員使用進化尺度模型(ESM-2),透過高效的微調方法訓練模型,無需大量計算資源。他們在局部和全局層面進行多項任務探索,最終開發出名為PatchProt的模型,能有效預測疏水性區域、二級結構及表面可及性,表現超越現有方法。研究顯示,結合局部任務可提升全局任務的預測準確性,為蛋白質性質預測設立新標準。 PubMed DOI


站上相關主題文章列表

ProGen是一個深度學習模型,可以像製造句子一樣,生成具有特定功能的蛋白質序列。透過大量蛋白質數據訓練後,ProGen可以微調,提升生成目標蛋白質的能力。這個模型可以創造人工蛋白質,效率與天然蛋白質相當,即使序列不同。適用於不同蛋白質家族,如輔酶A轉移酶和丙酮酸脫氫酶。 PubMed DOI

機器學習在預測蛋白質結構方面取得重大進展,利用演化數據進行序列比對。研究人員透過大型語言模型,能直接從原始序列推斷出蛋白質結構,並擴展至 150 億參數,加速高解析度結構預測。ESM Metagenomic Atlas 建立了超過 6.17 億宏基因組蛋白質序列的預測結構,提供廣泛且多樣的自然蛋白質洞察。 PubMed DOI

討論了使用ProtBERT模型預測肽類淀粉樣生成,是蛋白質摺疊中具挑戰性的議題。AggBERT是ProtBERT的半監督微調版本,在僅從序列預測淀粉樣纖維方面表現最佳。顯示大型語言模型相較傳統方法,在淀粉樣生成預測提升了準確性和速度。 PubMed DOI

蛋白質演化研究發現,自然蛋白偏好於廣泛、平坦的能量極小值空間。統計力學演算法比傳統方法更有效識別高熵谷,這些谷與自然序列相似且穩定。結合機器學習與統計物理學,探索蛋白質序列多樣性景觀。 PubMed DOI

蛋白質語言模型是強大的工具,可預測蛋白質結構、發現新功能性序列,並評估突變影響。研究指出這些模型可預測蛋白質間的相互作用熱點,並與傳統方法媲美。雖然成本效益高,但解釋特定特徵仍具挑戰性。 PubMed DOI

蛋白質在藥物研發中扮演重要角色,但傳統方法太貴又太慢。研究引入了一個快速又精確的分類器,使用了帶有ESM-2嵌入的蛋白質語言模型(PLM),準確率達95.11%。比較結果顯示,ESM-2嵌入比PSSM特徵更優。同時,開發了基於GPT-2的端對端模型,將大型語言模型成功應用在蛋白質辨識上,並經Pharos數據集驗證表現。 PubMed DOI

介紹了ProtAgents,一個利用大型語言模型設計新蛋白質的平台。多個人工智慧代理人合作應對複雜任務,擁有多樣能力。透過LLMs驅動的代理人合作,提供多功能蛋白質設計和分析方法。系統可設計新蛋白質、分析結構,並模擬振動頻率。自動化和協同方法可設計具特定機械性能的蛋白質,釋放解決多目標材料問題的潛力,為自主材料發現和設計鋪平道路。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)預測蛋白質相變(PPTs),對於理解與年齡相關的疾病如阿茲海默症非常重要。研究者微調了一個LLM,評估蛋白質序列變異對PPTs的影響,結果顯示該模型的表現超越傳統方法,並結合隨機森林模型提升可解釋性。此外,研究發現阿茲海默症相關蛋白質的聚集增加與基因表達下降有關,暗示可能存在自然防禦機制來對抗該疾病。 PubMed DOI

這項研究強調微調蛋白質語言模型在各種預測任務中的有效性,顯示針對特定任務的監督式微調能提升表現。研究比較了三個先進模型(ESM2、ProtT5、Ankh)在八個任務上的表現,結果顯示高效的微調能達到類似改善,並顯著減少資源消耗和訓練時間。特別對於數據集有限的任務,如預測單個蛋白質的適應性景觀,微調的做法更具價值。作者還提供了使用者友好的筆記本,方便進行模型微調。 PubMed DOI

預測蛋白質-蛋白質相互作用位點對於理解生化過程非常重要,尤其是在病毒與受體蛋白質的互動中,有助於疾病機制和藥物開發。傳統方法面臨處理時間長、成本高和準確性低的挑戰。為了解決這些問題,我們提出了一種新穎的網絡,利用多重信息融合來預測相互作用位點。透過圖卷積網絡、雙向長短期記憶(BiLSTM)和ProtT5模型,我們的模型在多項評估指標上超越現有方法,顯示出其有效性和優越性。 PubMed DOI