原始文章

ZHMolGraph是一種創新的方法,專門用來預測RNA與蛋白質之間的相互作用,成功解決了未知RNA和蛋白質的挑戰。它結合了圖神經網絡和無監督的大型語言模型,在基準數據集上表現優異,對完全未知的RNA-蛋白質對,AUROC達到79.8%,AUPRC為82.0%。這顯示出相較於現有方法的顯著進步,AUROC提升了7.1%-28.7%,AUPRC增加了4.6%-30.0%。此外,ZHMolGraph也能增強對SARS-CoV-2 RNA-蛋白質相互作用的預測,展現其在全基因組預測及複合體建模的潛力。 PubMed DOI


站上相關主題文章列表

這項研究探討了研究人員在處理大量生物醫學文獻時的挑戰,並提出了一種混合方法,結合文本挖掘、圖神經網絡(GNNs)和微調的大型語言模型(LLMs)。這種方法旨在增強生物醫學知識圖譜,並解釋預測的關係。研究顯示,該方法在蛋白質相互作用數據集上達到0.772的馬修斯相關係數,並在失眠研究中識別出25個新的人類蛋白質相互作用。這種方法有助於加速治療靶點的發現,並提高文獻分析的效率。 PubMed DOI

RNA 正在成為新療法的焦點,但找到能與其結合的小分子仍然是一大挑戰。計算模型在預測 RNA 與小分子的互動上顯得尤為重要。最近,針對 RNA 的大型語言模型(LLMs)取得了進展,促使我們開發了 RNABind,這是一個幾何深度學習框架,能根據 RNA 結構識別結合位點。經過實驗,RNABind 的表現超越了現有方法,並為 RNA 相關的藥物發現提供了新的可能性。 PubMed DOI

這項研究介紹了GL4SDA,一種新方法,結合圖神經網絡和大型語言模型,來預測小核醣核酸(snoRNAs)與疾病的關聯。考量到snoRNAs在細胞過程中的重要性,這項研究希望增進對其與疾病關係的理解,助於未來的治療應用。 GL4SDA利用異質圖結構,整合snoRNAs的二級結構及疾病資訊,創建全面的圖形表示,預測性能超越現有方法。評估結果顯示,GL4SDA在鏈接預測任務中表現優於三個先進預測器,並透過癌症案例進一步驗證其實用性,對生物研究具有重要意義。 PubMed DOI

近年來,受到DNA和蛋白質大型語言模型的啟發,幾個針對RNA的大型語言模型相繼問世。這些RNA-LLMs透過大量RNA數據集自我學習,旨在提升RNA二級結構預測的準確性。然而,針對這項任務的統一評估仍然不足。本研究對多種預訓練RNA-LLMs進行深入比較,評估它們在二級結構預測中的表現。結果顯示,有兩個模型表現優異,並揭示了低同源性情境下的挑戰。此外,研究提供了不同難度的基準數據集和標準化實驗設置,相關代碼和數據可在GitHub上獲得。 PubMed DOI

**重點摘要:** 深度學習已經徹底改變了蛋白質結構預測的領域,成功彌補了大量蛋白質序列與有限實驗決定結構之間的落差。這篇綜述整理了主要的資料庫、深度學習與大型語言模型在蛋白質結構預測上的最新進展,並討論了這個領域未來的挑戰與機會,特別強調其對藥物發現與開發的影響。 PubMed DOI

這項研究用大型語言模型把蛋白質序列轉成SMILES格式,再結合圖神經網路,準確辨識CRISPR-Cas系統裡的Cas1蛋白。新方法比現有工具更準確,還能在大數據中找到新Cas1候選蛋白,展現高穩定性。未來也有機會應用在其他Cas蛋白辨識,證明SMILES編碼在蛋白質分析上很有潛力。 PubMed DOI

這篇研究提出 ProtFun 深度學習模型,結合蛋白質語言模型嵌入、家族網路資訊(用圖注意力網路)和蛋白質特徵,來預測蛋白質功能。實驗結果顯示 ProtFun 在標準資料集上表現比現有方法更好,程式碼也已經公開。 PubMed DOI

蛋白質-蛋白質交互作用(PPIs)對疾病研究和藥物開發很重要,但從眾多模擬結構中挑出最準確的很困難。DeepRank-GNN-esm 是一款深度學習工具,結合圖形化方法和蛋白質語言模型,能有效排序並選出最佳PPI模型。詳細教學和工具下載可參考 https://github.com/haddocking/DeepRank-GNN-esm。 PubMed DOI

蛋白質-蛋白質交互作用(PPIs)對生物研究和新藥開發很關鍵。現在大型語言模型(LLMs)已能從蛋白質序列分析PPIs,處理大規模資料也沒問題。不過,還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化,讓LLMs在生物領域發揮更大作用。 PubMed DOI

RNA除了攜帶遺傳資訊,還有許多結構相關的功能。雖然AI和大型語言模型(LLMs)在蛋白質結構預測上很有成效,但目前幾個主流的核酸語言模型(如RNABERT、ERNIE-RNA等)在RNA三維結構預測上表現有限,主要是因為模型設計上還有不少瓶頸。 PubMed DOI