原始文章

這篇研究提出 ProtFun 深度學習模型,結合蛋白質語言模型嵌入、家族網路資訊(用圖注意力網路)和蛋白質特徵,來預測蛋白質功能。實驗結果顯示 ProtFun 在標準資料集上表現比現有方法更好,程式碼也已經公開。 PubMed DOI


站上相關主題文章列表

介紹了ProtAgents,一個利用大型語言模型設計新蛋白質的平台。多個人工智慧代理人合作應對複雜任務,擁有多樣能力。透過LLMs驅動的代理人合作,提供多功能蛋白質設計和分析方法。系統可設計新蛋白質、分析結構,並模擬振動頻率。自動化和協同方法可設計具特定機械性能的蛋白質,釋放解決多目標材料問題的潛力,為自主材料發現和設計鋪平道路。 PubMed DOI

這項研究強調微調蛋白質語言模型在各種預測任務中的有效性,顯示針對特定任務的監督式微調能提升表現。研究比較了三個先進模型(ESM2、ProtT5、Ankh)在八個任務上的表現,結果顯示高效的微調能達到類似改善,並顯著減少資源消耗和訓練時間。特別對於數據集有限的任務,如預測單個蛋白質的適應性景觀,微調的做法更具價值。作者還提供了使用者友好的筆記本,方便進行模型微調。 PubMed DOI

為蛋白質準確標註功能和催化活性是一項挑戰,尤其是對於缺乏同源蛋白的情況。傳統方法多依賴蛋白質序列,忽略了標籤的語義。為了解決這個問題,我們提出了FAPM模型,結合了蛋白質序列和自然語言,能生成基因本體(GO)功能術語和催化活性預測。研究顯示,FAPM在理解蛋白質特性上表現優於傳統模型,並在噬菌體蛋白的測試中達到最先進的結果。這種方法為蛋白質註釋提供了新的可能性。線上演示可在此網址找到:https://huggingface.co/spaces/wenkai/FAPM_demo。 PubMed DOI

ProtChat是一個創新的AI多代理系統,專門用於蛋白質分析,結合了蛋白質大型語言模型和像GPT-4這樣的技術。它能自動化複雜任務,如預測蛋白質特性和分析蛋白質-藥物相互作用,大幅減少人力需求。即使沒有計算背景的研究人員也能輕鬆使用,提升分析效率。實驗結果顯示,ProtChat能快速且準確地處理蛋白質相關任務,為計算生物學和藥物發現開創新機會。其程式碼和數據已在GitHub上公開,鼓勵更多人探索應用。 PubMed DOI

蛋白質語言模型(pLMs)正逐漸成為理解蛋白質序列及其功能的重要工具,特別是在預測分子功能方面,如識別結合位點和評估基因變異影響。不過,單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM,可以提升其效率和準確性,尤其在實驗數據不足的情況下。總的來說,pLM為計算生物學與實驗生物學的整合鋪路,預示著蛋白質設計的新時代。 PubMed DOI

這項研究提出了PKAN新架構,結合多模態表徵和語言模型概念,能更準確預測胜肽的活性與功能,表現優於現有方法。PKAN也有助於解析影響胜肽功能的關鍵特徵,推動生物學上胜肽語言模型的發展。 PubMed DOI

**重點摘要:** 深度學習已經徹底改變了蛋白質結構預測的領域,成功彌補了大量蛋白質序列與有限實驗決定結構之間的落差。這篇綜述整理了主要的資料庫、深度學習與大型語言模型在蛋白質結構預測上的最新進展,並討論了這個領域未來的挑戰與機會,特別強調其對藥物發現與開發的影響。 PubMed DOI

這項研究用先進AI模型分析牙齦卟啉單胞菌的蛋白質序列,成功預測抗生素抗藥性。透過LSTM-attention、ProtBERT等模型,能高準確率辨識抗藥性菌株,有助於追蹤和預防抗藥性問題,對全球抗藥性危機的治療策略很有幫助。 PubMed DOI

作者提出一套新方法,結合半監督神經網路(Seq2Fitness)和創新最佳化演算法(BADASS),能更準確預測蛋白質適應度,並有效率產生多樣且高適應度的蛋白質序列。這方法比現有技術更省資源、效果更好,未來也有機會應用在 DNA、RNA 等其他生物序列上。 PubMed DOI

這篇研究發現,結合圖形和3D結構資料的蛋白質幾何深度模型(GDMs)能和大型語言模型(LLMs)更好對齊,且LLMs規模越大效果越好。罕見蛋白質較難對齊,但提升GDM嵌入維度、用兩層投影頭、或針對蛋白質微調LLM都能改善。對齊提升後,下游任務表現更好,也能減少模型產生錯誤資訊。 PubMed DOI