原始文章

Token-Mol 是專為藥物設計打造的新型 transformer 架構,能同時編碼分子的 2D 和 3D 資訊。它用創新損失函數提升回歸表現,在分子構象生成、性質預測和藥物分子設計上都優於傳統模型,運算速度也比 diffusion models 快很多。結合強化學習後,藥物開發成效會更好。 PubMed DOI


站上相關主題文章列表

最近大型語言模型(LLMs)在藥物發現中的應用引起關注,特別是在分子優化方面。大多數現有方法未能納入專家反饋,缺乏迭代和經驗性特徵。為了解決這個問題,我們推出了DrugAssist,一個透過人機對話增強分子優化的互動模型。DrugAssist在優化多個性質上表現優異,顯示出其可轉移性和改進潛力。此外,我們還發布了'MolOpt-Instructions'數據集,以促進語言模型的微調。相關代碼和數據集可在 https://github.com/blazerye/DrugAssist 獲得,支持未來的研究。 PubMed DOI

Llama-Gram是一個創新的AI框架,專為化學藥物發現設計,旨在克服傳統大型語言模型的限制,特別是避免不準確的輸出。它結合蛋白質摺疊嵌入和圖形分子表示,提升對蛋白質-配體相互作用的理解,對藥物開發至關重要。透過ESMFold模型和專用的圖形變壓器,Llama-Gram運用先進技術來提高預測準確性,並在化合物-靶標相互作用的預測上顯示出優勢,可能顯著加速藥物發現的進程。 PubMed DOI

最近,人工智慧在分子設計上有了新進展,讓合成化學家能更輕鬆地創造特定功能的分子。雖然已有多款AI分子生成器,但使用這些工具仍需專業知識。為了解決這個問題,我們開發了ChatChemTS,一個基於大型語言模型的聊天機器人,透過簡單對話幫助設計新分子,並自動生成獎勵函數。我們的研究展示了它在設計色素和抗癌藥物方面的能力。ChatChemTS已開源,並可在GitHub上獲得,網址是 https://github.com/molecule-generator-collection/ChatChemTS。這項技術讓更多人能輕鬆使用AI進行分子設計。 PubMed DOI

設計多樣性藥物分子一直是個挑戰,但最近深度學習的進展,特別是去噪擴散模型,顯示出解決此問題的潛力。本研究提出的DiffMC-Gen模型,結合離散與連續特徵,能更好理解三維分子結構,並採用多目標優化策略來提升分子的結合親和力、相似性、合成性和毒性。DiffMC-Gen生成的分子在新穎性和獨特性上表現優異,並對三個目標蛋白質展現出良好的生物活性,顯示其在藥物設計上的應用潛力。 PubMed DOI

傳統藥物設計又慢又容易失敗,深度學習模型像DrugGPT雖然能產生新分子,但常常沒用。DrugGen是改良版,結合真實資料和優化技術,能產生100%有效分子,預測和多樣性都更好。測試證明它有效,還能幫助藥物再利用和新藥設計,大大提升藥物開發效率。 PubMed DOI

作者提出TSMMG大型語言模型,能根據自然語言描述的多重性質限制,生成全新分子。TSMMG向多個專家模型學習,可同時滿足多種性質要求,分子有效率超過99%,成功率高。它也能應對沒見過的性質組合和不同語言提示,對藥物開發等領域很有幫助。 PubMed DOI

作者提出 ChemLML 這個輕量級方法,把現有的文字和分子模型結合起來,能直接從文字描述產生新分子,不用從零訓練模型,省下不少算力。分子表示法選擇很重要,SMILES 通常比 SELFIES 表現更好。作者也討論資料集問題,並證明 ChemLML 在藥物分子生成和評估上很有成效。 PubMed

作者介紹 SynLlama,一款專為小分子藥物合成路徑設計的 Llama3 微調模型。它能用常見原料和穩定反應模板,規劃出實用的合成步驟。SynLlama 資料需求低,對新原料也能應用,生成類似物和 hit expansion 表現都很優秀,是藥物化學家的實用工具。 PubMed

生成式AI正加速新藥研發,能深入分析複雜生物和化學資料。這篇綜述介紹主流AI模型、分子表徵和評估方式,並說明在蛋白質交互、藥物設計等應用。雖然潛力大,但還有模型解釋性差、資料不足等挑戰。文中也建議用混合模型、資料增強、雲端運算等方法來突破,並強調跨領域合作的重要性。 PubMed DOI

這篇論文推出 M³-20M 超大多模態分子資料集,收錄超過兩千萬個分子,規模比以往大71倍,結合 SMILES、2D/3D 結構、分子性質和文字描述(部分由 GPT-3.5 產生)。實驗證明,用這資料集訓練的模型在分子生成和性質預測上表現更好,對 AI 輔助藥物設計很有幫助。資料集連結:https://github.com/bz99bz/M-3 PubMed DOI