Using Large Language Model to Optimize Protein Purification: Insights from Protein Structure Literature Associated with Protein Data Bank.
利用大型語言模型優化蛋白質純化:來自與蛋白質數據庫相關的蛋白質結構文獻的見解。
Adv Sci (Weinh) 2025-02-20
Automated Retrosynthesis Planning of Macromolecules Using Large Language Models and Knowledge Graphs.
使用大型語言模型和知識圖譜的巨分子自動逆合成規劃。
Macromol Rapid Commun 2025-02-27
M<sup>3</sup>-20M: A large-scale multi-modal molecule dataset for AI-driven drug design and discovery.
M<sup>3</sup>-20M:用於AI驅動藥物設計與發現的大規模多模態分子資料集
J Bioinform Comput Biol 2025-06-10
這篇論文推出 M³-20M 超大多模態分子資料集,收錄超過兩千萬個分子,規模比以往大71倍,結合 SMILES、2D/3D 結構、分子性質和文字描述(部分由 GPT-3.5 產生)。實驗證明,用這資料集訓練的模型在分子生成和性質預測上表現更好,對 AI 輔助藥物設計很有幫助。資料集連結:https://github.com/bz99bz/M-3
PubMedDOI