原始文章

Token-Mol 是專為藥物設計打造的新型 transformer 架構,能同時編碼分子的 2D 和 3D 資訊。它用創新損失函數提升回歸表現,在分子構象生成、性質預測和藥物分子設計上都優於傳統模型,運算速度也比 diffusion models 快很多。結合強化學習後,藥物開發成效會更好。 PubMed DOI


站上相關主題文章列表

分子生成是人工智慧的一個重要領域,對小分子藥物開發影響深遠。現有方法在某些設計上表現不佳,因此我們提出了FU-SMILES框架,透過片段簡化分子輸入,並推出了FragGPT這個通用分子生成模型。FragGPT在大型數據集上預訓練,能高效生成新分子、連接子設計等,並結合條件生成和強化學習技術,確保生成的分子符合生物學和物理化學標準。實驗結果顯示,FragGPT在生成創新結構的分子方面表現優異,超越現有模型,並在藥物設計中得到驗證。 PubMed DOI

小分子的設計對於藥物發現和能源儲存等技術應用非常重要。隨著合成化學的發展,科學界開始利用數據驅動和機器學習方法來探索設計空間。雖然生成式機器學習在分子設計上有潛力,但訓練過程複雜,且生成有效分子不易。研究顯示,預訓練的大型語言模型(LLMs)如Claude 3 Opus能根據自然語言指示創建和修改分子,達到97%的有效生成率。這些發現顯示LLMs在分子設計上具備強大潛力。 PubMed DOI

大型語言模型(LLMs)在藥物傳遞材料設計中展現潛力。我們使用Hugging Face的Transformers套件,透過BigBird、Gemma和GPT NeoX等架構進行預訓練和微調,並結合化學家的指導進行優化。研究結果顯示,整合化學見解對於提升模型性能至關重要。我們設計了光響應藥物傳遞分子,並探討了人類反饋在強化學習中的角色。最終,我們建立了一個高效的設計流程,但缺乏專門數據集仍是挑戰。 PubMed DOI

3DSMILES-GPT是一個創新的框架,專門用來生成三維(3D)分子,目的是提升藥物發現的效率。傳統方法常常產生無效的分子,且生成時間較長。相對之下,3DSMILES-GPT透過標記方式,將2D和3D分子視為語言來處理。經過大規模數據集的預訓練和微調後,該模型在結合親和力、藥物相似性(QED)和合成可及性評分(SAS)等指標上表現優異,生成速度也快,每個分子僅需約0.45秒,顯示出其在藥物發現中的巨大潛力。 PubMed DOI

最近大型語言模型(LLMs)在藥物發現中的應用引起關注,特別是在分子優化方面。大多數現有方法未能納入專家反饋,缺乏迭代和經驗性特徵。為了解決這個問題,我們推出了DrugAssist,一個透過人機對話增強分子優化的互動模型。DrugAssist在優化多個性質上表現優異,顯示出其可轉移性和改進潛力。此外,我們還發布了'MolOpt-Instructions'數據集,以促進語言模型的微調。相關代碼和數據集可在 https://github.com/blazerye/DrugAssist 獲得,支持未來的研究。 PubMed DOI

最近,人工智慧在分子設計上有了新進展,讓合成化學家能更輕鬆地創造特定功能的分子。雖然已有多款AI分子生成器,但使用這些工具仍需專業知識。為了解決這個問題,我們開發了ChatChemTS,一個基於大型語言模型的聊天機器人,透過簡單對話幫助設計新分子,並自動生成獎勵函數。我們的研究展示了它在設計色素和抗癌藥物方面的能力。ChatChemTS已開源,並可在GitHub上獲得,網址是 https://github.com/molecule-generator-collection/ChatChemTS。這項技術讓更多人能輕鬆使用AI進行分子設計。 PubMed DOI

傳統藥物設計又慢又容易失敗,深度學習模型像DrugGPT雖然能產生新分子,但常常沒用。DrugGen是改良版,結合真實資料和優化技術,能產生100%有效分子,預測和多樣性都更好。測試證明它有效,還能幫助藥物再利用和新藥設計,大大提升藥物開發效率。 PubMed DOI

作者提出TSMMG大型語言模型,能根據自然語言描述的多重性質限制,生成全新分子。TSMMG向多個專家模型學習,可同時滿足多種性質要求,分子有效率超過99%,成功率高。它也能應對沒見過的性質組合和不同語言提示,對藥物開發等領域很有幫助。 PubMed DOI

作者提出 ChemLML 這個輕量級方法,把現有的文字和分子模型結合起來,能直接從文字描述產生新分子,不用從零訓練模型,省下不少算力。分子表示法選擇很重要,SMILES 通常比 SELFIES 表現更好。作者也討論資料集問題,並證明 ChemLML 在藥物分子生成和評估上很有成效。 PubMed

作者介紹 SynLlama,一款專為小分子藥物合成路徑設計的 Llama3 微調模型。它能用常見原料和穩定反應模板,規劃出實用的合成步驟。SynLlama 資料需求低,對新原料也能應用,生成類似物和 hit expansion 表現都很優秀,是藥物化學家的實用工具。 PubMed