作者提出 ChemLML 這個輕量級方法,把現有的文字和分子模型結合起來,能直接從文字描述產生新分子,不用從零訓練模型,省下不少算力。分子表示法選擇很重要,SMILES 通常比 SELFIES 表現更好。作者也討論資料集問題,並證明 ChemLML 在藥物分子生成和評估上很有成效。 PubMed
作者介紹 SynLlama,一款專為小分子藥物合成路徑設計的 Llama3 微調模型。它能用常見原料和穩定反應模板,規劃出實用的合成步驟。SynLlama 資料需求低,對新原料也能應用,生成類似物和 hit expansion 表現都很優秀,是藥物化學家的實用工具。 PubMed