原始文章

設計多樣性藥物分子一直是個挑戰,但最近深度學習的進展,特別是去噪擴散模型,顯示出解決此問題的潛力。本研究提出的DiffMC-Gen模型,結合離散與連續特徵,能更好理解三維分子結構,並採用多目標優化策略來提升分子的結合親和力、相似性、合成性和毒性。DiffMC-Gen生成的分子在新穎性和獨特性上表現優異,並對三個目標蛋白質展現出良好的生物活性,顯示其在藥物設計上的應用潛力。 PubMed DOI


站上相關主題文章列表

生成式機器學習在使用SMILES語言設計藥物分子上取得成功。研究指出大型語言模型在藥物設計有潛力,透過預訓練的方式成功轉移到藥物領域,效果優於先前研究。這種模型能生成對特定靶點有效的分子,展現了在藥物發現上的潛力。這為未來更大型的研究提供可能性,有助於開發非專利的藥物替代品。 PubMed DOI

分子生成是人工智慧的一個重要領域,對小分子藥物開發影響深遠。現有方法在某些設計上表現不佳,因此我們提出了FU-SMILES框架,透過片段簡化分子輸入,並推出了FragGPT這個通用分子生成模型。FragGPT在大型數據集上預訓練,能高效生成新分子、連接子設計等,並結合條件生成和強化學習技術,確保生成的分子符合生物學和物理化學標準。實驗結果顯示,FragGPT在生成創新結構的分子方面表現優異,超越現有模型,並在藥物設計中得到驗證。 PubMed DOI

小分子的設計對於藥物發現和能源儲存等技術應用非常重要。隨著合成化學的發展,科學界開始利用數據驅動和機器學習方法來探索設計空間。雖然生成式機器學習在分子設計上有潛力,但訓練過程複雜,且生成有效分子不易。研究顯示,預訓練的大型語言模型(LLMs)如Claude 3 Opus能根據自然語言指示創建和修改分子,達到97%的有效生成率。這些發現顯示LLMs在分子設計上具備強大潛力。 PubMed DOI

大型語言模型(LLMs)在藥物傳遞材料設計中展現潛力。我們使用Hugging Face的Transformers套件,透過BigBird、Gemma和GPT NeoX等架構進行預訓練和微調,並結合化學家的指導進行優化。研究結果顯示,整合化學見解對於提升模型性能至關重要。我們設計了光響應藥物傳遞分子,並探討了人類反饋在強化學習中的角色。最終,我們建立了一個高效的設計流程,但缺乏專門數據集仍是挑戰。 PubMed DOI

開發新分子以推進藥物發現非常重要,因為這能省去探索目標基因的初步步驟。傳統方法常依賴現有數據篩選分子,但因數據集有限,可能受到限制。為了解決這些問題,我們推出了GexMolGen,這是一種根據基因表達特徵生成類似命中分子的全新方法。它透過「先對齊再生成」的策略,將基因表達特徵與分子表示對齊,並確保生成的分子結構有效。實證結果顯示,GexMolGen能生成與已知物質相似的分子,為藥物發現提供了新途徑。 PubMed DOI

這篇文章探討了生成模型在分子逆向設計中的挑戰與潛力,特別是在數據稀缺的情況下如何預測特定性質的分子。傳統模型因數據有限,難以準確映射稀有但重要的分子性質。作者提出透過提供多個性質來創造獨特的映射,進而改善預測。為此,他們開發了「大型性質模型」(LPMs),這些模型基於性質到分子圖的任務訓練,並結合豐富的化學性質數據來增強訓練。文章還介紹了模型架構及案例研究,展示其有效性。 PubMed DOI

3DSMILES-GPT是一個創新的框架,專門用來生成三維(3D)分子,目的是提升藥物發現的效率。傳統方法常常產生無效的分子,且生成時間較長。相對之下,3DSMILES-GPT透過標記方式,將2D和3D分子視為語言來處理。經過大規模數據集的預訓練和微調後,該模型在結合親和力、藥物相似性(QED)和合成可及性評分(SAS)等指標上表現優異,生成速度也快,每個分子僅需約0.45秒,顯示出其在藥物發現中的巨大潛力。 PubMed DOI

最近大型語言模型(LLMs)在藥物發現中的應用引起關注,特別是在分子優化方面。大多數現有方法未能納入專家反饋,缺乏迭代和經驗性特徵。為了解決這個問題,我們推出了DrugAssist,一個透過人機對話增強分子優化的互動模型。DrugAssist在優化多個性質上表現優異,顯示出其可轉移性和改進潛力。此外,我們還發布了'MolOpt-Instructions'數據集,以促進語言模型的微調。相關代碼和數據集可在 https://github.com/blazerye/DrugAssist 獲得,支持未來的研究。 PubMed DOI

肽類療法在治療糖尿病和癌症方面表現出色,特別是GLP-1受體激動劑對2型糖尿病和肥胖症的療效。然而,設計符合多重標準的肽類仍具挑戰。為此,我們推出了PepTune,一種專門用於生成和優化治療性肽的模型。透過蒙地卡羅樹搜索策略,PepTune能有效平衡探索與利用,生成具多樣化特性的肽,並解決了在離散空間中面臨的挑戰。我們的研究顯示,這種方法在肽設計上具備穩健性與靈活性。 PubMed DOI

這份報告探討了X-LoRA-Gemma大型語言模型(LLM)的應用,這是一個擁有70億參數的多代理生成式人工智慧框架,專注於分子設計。模型結合人類與AI的合作,透過雙重推理策略來優化分子互動,並使用主成分分析等技術識別目標性質。生成的候選分子顯示出預期的特性,報告預測這些AI技術將在分子工程中越來越普遍,並提供創新解決方案,同時也討論了相關的挑戰與機會。 PubMed DOI