原始文章

這項研究探討如何利用大型語言模型(LLMs)預測蛋白質相變(PPTs),對於理解與年齡相關的疾病如阿茲海默症非常重要。研究者微調了一個LLM,評估蛋白質序列變異對PPTs的影響,結果顯示該模型的表現超越傳統方法,並結合隨機森林模型提升可解釋性。此外,研究發現阿茲海默症相關蛋白質的聚集增加與基因表達下降有關,暗示可能存在自然防禦機制來對抗該疾病。 PubMed DOI


站上相關主題文章列表

ProGen是一個深度學習模型,可以像製造句子一樣,生成具有特定功能的蛋白質序列。透過大量蛋白質數據訓練後,ProGen可以微調,提升生成目標蛋白質的能力。這個模型可以創造人工蛋白質,效率與天然蛋白質相當,即使序列不同。適用於不同蛋白質家族,如輔酶A轉移酶和丙酮酸脫氫酶。 PubMed DOI

機器學習在預測蛋白質結構方面取得重大進展,利用演化數據進行序列比對。研究人員透過大型語言模型,能直接從原始序列推斷出蛋白質結構,並擴展至 150 億參數,加速高解析度結構預測。ESM Metagenomic Atlas 建立了超過 6.17 億宏基因組蛋白質序列的預測結構,提供廣泛且多樣的自然蛋白質洞察。 PubMed DOI

像ProGen2和IgLM這樣的大型語言模型正被應用在蛋白工程領域,以更有效地設計蛋白質。 PubMed DOI

最新的語言模型對蛋白質研究有重大影響,特別是GPT-4等模型展現出潛力,可應用在蛋白質領域。蛋白質語言模型已顯示出預測和創新蛋白質的能力,並取得重要進展。本文討論了這個新興領域的機會和挑戰,並提供了LLMs對蛋白質研究的影響。 PubMed DOI

蛋白質演化研究發現,自然蛋白偏好於廣泛、平坦的能量極小值空間。統計力學演算法比傳統方法更有效識別高熵谷,這些谷與自然序列相似且穩定。結合機器學習與統計物理學,探索蛋白質序列多樣性景觀。 PubMed DOI

生物資訊學中,分析蛋白質結構對於尋找藥物、診斷疾病和研究演化至關重要。目前的方法偏向序列,忽略了3D結構。這項研究提出結合3D結構資訊,特別是接觸圖,設計蛋白質在歐幾里得空間的數值嵌入。這些嵌入結合了大型語言模型和傳統技術特徵,在監督式蛋白質分析中表現更好。實驗結果顯示,這種方法在蛋白質功能預測方面優於現有方法。 PubMed DOI

蛋白質語言模型是強大的工具,可預測蛋白質結構、發現新功能性序列,並評估突變影響。研究指出這些模型可預測蛋白質間的相互作用熱點,並與傳統方法媲美。雖然成本效益高,但解釋特定特徵仍具挑戰性。 PubMed DOI

蛋白質在藥物研發中扮演重要角色,但傳統方法太貴又太慢。研究引入了一個快速又精確的分類器,使用了帶有ESM-2嵌入的蛋白質語言模型(PLM),準確率達95.11%。比較結果顯示,ESM-2嵌入比PSSM特徵更優。同時,開發了基於GPT-2的端對端模型,將大型語言模型成功應用在蛋白質辨識上,並經Pharos數據集驗證表現。 PubMed DOI

大型語言模型(LLMs)在醫學和臨床資訊學中扮演重要角色,能幫助突破和個人化治療。透過分析複雜的生物數據,揭示基因組學、蛋白質結構和健康記錄中的隱藏模式,對基因組分析、藥物開發和精準醫學有所助益。然而,必須面對數據偏見、隱私和道德等挑戰,才能負責任地應用。克服這些障礙將帶來分子生物學和製藥研究的重大進展,造福個人和社區。 PubMed DOI

介紹了ProtAgents,一個利用大型語言模型設計新蛋白質的平台。多個人工智慧代理人合作應對複雜任務,擁有多樣能力。透過LLMs驅動的代理人合作,提供多功能蛋白質設計和分析方法。系統可設計新蛋白質、分析結構,並模擬振動頻率。自動化和協同方法可設計具特定機械性能的蛋白質,釋放解決多目標材料問題的潛力,為自主材料發現和設計鋪平道路。 PubMed DOI