原始文章

RNA 正在成為新療法的焦點,但找到能與其結合的小分子仍然是一大挑戰。計算模型在預測 RNA 與小分子的互動上顯得尤為重要。最近,針對 RNA 的大型語言模型(LLMs)取得了進展,促使我們開發了 RNABind,這是一個幾何深度學習框架,能根據 RNA 結構識別結合位點。經過實驗,RNABind 的表現超越了現有方法,並為 RNA 相關的藥物發現提供了新的可能性。 PubMed DOI


站上相關主題文章列表

生成式機器學習在使用SMILES語言設計藥物分子上取得成功。研究指出大型語言模型在藥物設計有潛力,透過預訓練的方式成功轉移到藥物領域,效果優於先前研究。這種模型能生成對特定靶點有效的分子,展現了在藥物發現上的潛力。這為未來更大型的研究提供可能性,有助於開發非專利的藥物替代品。 PubMed DOI

大型語言模型(LLMs)在醫學和臨床資訊學中扮演重要角色,能幫助突破和個人化治療。透過分析複雜的生物數據,揭示基因組學、蛋白質結構和健康記錄中的隱藏模式,對基因組分析、藥物開發和精準醫學有所助益。然而,必須面對數據偏見、隱私和道德等挑戰,才能負責任地應用。克服這些障礙將帶來分子生物學和製藥研究的重大進展,造福個人和社區。 PubMed DOI

在生物醫學領域,分析藥物相互作用對藥物發現至關重要。目前使用的人工智慧工具受限於編碼生物醫學功能和概念。LEDAP利用大型語言模型如ChatGPT,展現了預測藥物相關關聯的潛力。這些模型對自然語言有全面理解,在藥物開發分析中具潛力。LEDAP結合傳統機器學習方法,表現競爭性。這研究凸顯大型語言模型在藥物開發的重要潛力,為該領域帶來更多發展機會。 PubMed DOI

小分子的設計對於藥物發現和能源儲存等技術應用非常重要。隨著合成化學的發展,科學界開始利用數據驅動和機器學習方法來探索設計空間。雖然生成式機器學習在分子設計上有潛力,但訓練過程複雜,且生成有效分子不易。研究顯示,預訓練的大型語言模型(LLMs)如Claude 3 Opus能根據自然語言指示創建和修改分子,達到97%的有效生成率。這些發現顯示LLMs在分子設計上具備強大潛力。 PubMed DOI

GenerRNA是一個創新的Transformer模型,專注於提升RNA設計,特別是在RNA疫苗和治療方面。與傳統依賴結構或先前知識的方法不同,GenerRNA透過大量RNA序列進行預訓練,能生成穩定的二級結構RNA序列。這個模型可以在小型數據集上微調,創造出具特定功能的RNA,無需先前輸入。我們的示範成功生成了對目標蛋白質高親和力的RNA序列,開創了生成式語言模型在RNA生成上的新應用,提供了一種全新的RNA設計方式。 PubMed DOI

最近,人工智慧(AI)和深度學習(DL)在醫療保健領域的進展非常顯著,尤其是大型語言模型(LLMs)的應用。這些模型改善了研究人員與AI系統的溝通,特別是在藥物開發上。回顧中強調了LLM在製藥領域的創新,並探討了其技術和倫理挑戰。預期未來LLM將在創新藥物的開發中扮演更重要的角色,助力突破性製藥的進展。 PubMed DOI

大型語言模型(LLMs)在生物學和化學等複雜領域中影響深遠,特別是在分子設計和優化方面。本篇綜述專注於LLMs在抗生素發現與設計中的應用,特別是肽類分子。我們將探討LLMs在藥物設計的最新進展,以及在抗生素開發中應用這些模型所面臨的挑戰。 PubMed DOI

ZHMolGraph是一種創新的方法,專門用來預測RNA與蛋白質之間的相互作用,成功解決了未知RNA和蛋白質的挑戰。它結合了圖神經網絡和無監督的大型語言模型,在基準數據集上表現優異,對完全未知的RNA-蛋白質對,AUROC達到79.8%,AUPRC為82.0%。這顯示出相較於現有方法的顯著進步,AUROC提升了7.1%-28.7%,AUPRC增加了4.6%-30.0%。此外,ZHMolGraph也能增強對SARS-CoV-2 RNA-蛋白質相互作用的預測,展現其在全基因組預測及複合體建模的潛力。 PubMed DOI

近年來,受到DNA和蛋白質大型語言模型的啟發,幾個針對RNA的大型語言模型相繼問世。這些RNA-LLMs透過大量RNA數據集自我學習,旨在提升RNA二級結構預測的準確性。然而,針對這項任務的統一評估仍然不足。本研究對多種預訓練RNA-LLMs進行深入比較,評估它們在二級結構預測中的表現。結果顯示,有兩個模型表現優異,並揭示了低同源性情境下的挑戰。此外,研究提供了不同難度的基準數據集和標準化實驗設置,相關代碼和數據可在GitHub上獲得。 PubMed DOI

這項研究強調準確識別蛋白質-DNA結合位點的重要性,對理解生物過程和推進藥物發現至關重要。傳統生化方法雖然是金標準,但因耗時耗資而不實用,因此需要高效的計算方法來預測這些位點。 文章將計算方法分為三類:模板檢測、統計機器學習和深度學習,並用136個非冗餘蛋白質的基準評估14個預測模型。結果顯示,深度學習方法,特別是利用預訓練大型語言模型的,準確性最佳。此外,研究還探討了這些預測方法在生物研究和藥物設計中的應用潛力。 PubMed DOI