原始文章

RNA 正在成為新療法的焦點,但找到能與其結合的小分子仍然是一大挑戰。計算模型在預測 RNA 與小分子的互動上顯得尤為重要。最近,針對 RNA 的大型語言模型(LLMs)取得了進展,促使我們開發了 RNABind,這是一個幾何深度學習框架,能根據 RNA 結構識別結合位點。經過實驗,RNABind 的表現超越了現有方法,並為 RNA 相關的藥物發現提供了新的可能性。 PubMed DOI


站上相關主題文章列表

大型語言模型(LLMs)在醫學和臨床資訊學中扮演重要角色,能幫助突破和個人化治療。透過分析複雜的生物數據,揭示基因組學、蛋白質結構和健康記錄中的隱藏模式,對基因組分析、藥物開發和精準醫學有所助益。然而,必須面對數據偏見、隱私和道德等挑戰,才能負責任地應用。克服這些障礙將帶來分子生物學和製藥研究的重大進展,造福個人和社區。 PubMed DOI

最近,人工智慧(AI)和深度學習(DL)在醫療保健領域的進展非常顯著,尤其是大型語言模型(LLMs)的應用。這些模型改善了研究人員與AI系統的溝通,特別是在藥物開發上。回顧中強調了LLM在製藥領域的創新,並探討了其技術和倫理挑戰。預期未來LLM將在創新藥物的開發中扮演更重要的角色,助力突破性製藥的進展。 PubMed DOI

大型語言模型(LLMs)在生物學和化學等複雜領域中影響深遠,特別是在分子設計和優化方面。本篇綜述專注於LLMs在抗生素發現與設計中的應用,特別是肽類分子。我們將探討LLMs在藥物設計的最新進展,以及在抗生素開發中應用這些模型所面臨的挑戰。 PubMed DOI

ZHMolGraph是一種創新的方法,專門用來預測RNA與蛋白質之間的相互作用,成功解決了未知RNA和蛋白質的挑戰。它結合了圖神經網絡和無監督的大型語言模型,在基準數據集上表現優異,對完全未知的RNA-蛋白質對,AUROC達到79.8%,AUPRC為82.0%。這顯示出相較於現有方法的顯著進步,AUROC提升了7.1%-28.7%,AUPRC增加了4.6%-30.0%。此外,ZHMolGraph也能增強對SARS-CoV-2 RNA-蛋白質相互作用的預測,展現其在全基因組預測及複合體建模的潛力。 PubMed DOI

近年來,受到DNA和蛋白質大型語言模型的啟發,幾個針對RNA的大型語言模型相繼問世。這些RNA-LLMs透過大量RNA數據集自我學習,旨在提升RNA二級結構預測的準確性。然而,針對這項任務的統一評估仍然不足。本研究對多種預訓練RNA-LLMs進行深入比較,評估它們在二級結構預測中的表現。結果顯示,有兩個模型表現優異,並揭示了低同源性情境下的挑戰。此外,研究提供了不同難度的基準數據集和標準化實驗設置,相關代碼和數據可在GitHub上獲得。 PubMed DOI

這項研究強調準確識別蛋白質-DNA結合位點的重要性,對理解生物過程和推進藥物發現至關重要。傳統生化方法雖然是金標準,但因耗時耗資而不實用,因此需要高效的計算方法來預測這些位點。 文章將計算方法分為三類:模板檢測、統計機器學習和深度學習,並用136個非冗餘蛋白質的基準評估14個預測模型。結果顯示,深度學習方法,特別是利用預訓練大型語言模型的,準確性最佳。此外,研究還探討了這些預測方法在生物研究和藥物設計中的應用潛力。 PubMed DOI

傳統藥物設計又慢又容易失敗,深度學習模型像DrugGPT雖然能產生新分子,但常常沒用。DrugGen是改良版,結合真實資料和優化技術,能產生100%有效分子,預測和多樣性都更好。測試證明它有效,還能幫助藥物再利用和新藥設計,大大提升藥物開發效率。 PubMed DOI

蛋白質-蛋白質交互作用(PPIs)對疾病研究和藥物開發很重要,但從眾多模擬結構中挑出最準確的很困難。DeepRank-GNN-esm 是一款深度學習工具,結合圖形化方法和蛋白質語言模型,能有效排序並選出最佳PPI模型。詳細教學和工具下載可參考 https://github.com/haddocking/DeepRank-GNN-esm。 PubMed DOI

蛋白質-蛋白質交互作用(PPIs)對生物研究和新藥開發很關鍵。現在大型語言模型(LLMs)已能從蛋白質序列分析PPIs,處理大規模資料也沒問題。不過,還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化,讓LLMs在生物領域發揮更大作用。 PubMed DOI

RNA除了攜帶遺傳資訊,還有許多結構相關的功能。雖然AI和大型語言模型(LLMs)在蛋白質結構預測上很有成效,但目前幾個主流的核酸語言模型(如RNABERT、ERNIE-RNA等)在RNA三維結構預測上表現有限,主要是因為模型設計上還有不少瓶頸。 PubMed DOI