Human interpretable structure-property relationships in chemistry using explainable machine learning and large language models.
使用可解釋的機器學習和大型語言模型在人類可解釋的化學結構-性質關係。 Commun Chem 2025-01-14

可解釋的人工智慧（XAI）是一個快速發展的領域，旨在讓機器學習模型更透明易懂。在化學領域，XAI 對於揭示分子結構與性質的關係特別重要，但現有方法多數針對專業人士，限制了普及性。為了解決這個問題，我們提出了 XpertAI 框架，結合 XAI 技術與大型語言模型（LLMs），能夠自動生成化學數據的自然語言解釋，讓更多人能理解。我們進行了五個案例研究，結果顯示 XpertAI 成功結合了 LLMs 和 XAI 工具，提供具體且科學準確的解釋，讓複雜的化學數據更易於理解。 PubMed DOI

Explainable Synthesizability Prediction of Inorganic Crystal Polymorphs using Large Language Models.
使用大型語言模型進行無機晶體多型體的可解釋合成性預測。 Angew Chem Int Ed Engl 2025-02-13

這項研究探討了機器學習在預測假想晶體結構可合成性上的應用，特別是微調過的大型語言模型（LLMs）。這些模型在訓練時使用人類可讀的結構描述，表現與傳統卷積圖神經網絡相當。透過正標籤-未標籤學習模型及結構的文本嵌入表示，預測準確性更佳。此外，LLM能生成清晰的解釋，幫助化學家理解影響合成的因素，並優化無法合成的結構，協助設計新材料。 PubMed DOI

Ai-enabled language models (LMs) to large language models (LLMs) and multimodal large language models (MLLMs) in drug discovery and development.
在藥物發現與開發中，AI 驅動的語言模型（LMs）、大型語言模型（LLMs）及多模態大型語言模型（MLLMs）。 J Adv Res 2025-02-14

這篇文章探討了人工智慧驅動的大型語言模型（LLMs）在藥物發現與開發中的影響，特別是它們如何解決傳統方法的時間與成本問題。文章介紹了LLMs在藥物發現各階段的應用，包括藥物設計、靶點識別、驗證及相互作用分析等。此外，還提到針對藥物發現的專屬LLMs的發展及其挑戰，並展望未來人工智慧在藥物開發中的整合潛力。 PubMed DOI

Chemical Language Model Linker: blending text and molecules with modular adapters.
化學語言模型連結器：以模組化轉接器融合文本與分子 ArXiv 2025-05-05

作者提出 ChemLML 這個輕量級方法，把現有的文字和分子模型結合起來，能直接從文字描述產生新分子，不用從零訓練模型，省下不少算力。分子表示法選擇很重要，SMILES 通常比 SELFIES 表現更好。作者也討論資料集問題，並證明 ChemLML 在藥物分子生成和評估上很有成效。 PubMed

SynLlama: Generating Synthesizable Molecules and Their Analogs with Large Language Models.
SynLlama：利用大型語言模型生成可合成分子及其類似物 ArXiv 2025-05-05

作者介紹 SynLlama，一款專為小分子藥物合成路徑設計的 Llama3 微調模型。它能用常見原料和穩定反應模板，規劃出實用的合成步驟。SynLlama 資料需求低，對新原料也能應用，生成類似物和 hit expansion 表現都很優秀，是藥物化學家的實用工具。 PubMed

Empowering Generalist Material Intelligence with Large Language Models.
以大型語言模型賦能通用材料智能 Adv Mater 2025-05-12

大型語言模型正帶動材料科學革新，讓自動化材料發現成真，像是資料擷取、性質預測都更有效率。不過，目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度，才能讓這些技術在實際應用上更可靠、更公平。 PubMed DOI

XMolCap: Advancing Molecular Captioning through Multimodal Fusion and Explainable Graph Neural Networks.
XMolCap：透過多模態融合與可解釋圖神經網路推進分子描述技術 IEEE J Biomed Health Inform 2025-05-23

XMolCap 是一套全新分子描述系統，結合分子影像、SMILES 字串和圖結構，透過多模態融合技術，能產生可解釋又精確的分子描述。它基於 BioT5 架構，並用 SwinOCSR、SciBERT、GIN-MoMu 等模型萃取特徵，表現優於現有方法，對新藥開發很有幫助。程式碼已開源，有興趣可到 GitHub 查看。 PubMed DOI

GICL: A Cross-Modal Drug Property Prediction Framework Based on Knowledge Enhancement of Large Language Models.
GICL：基於大型語言模型知識增強的跨模態藥物性質預測框架 J Chem Inf Model 2025-05-28

這篇研究提出GICL框架，把藥物SMILES字串的大型語言模型嵌入和分子影像結合，利用跨模態對比學習整合資訊。這種融合方式讓GICL在藥物性質預測（ADMET）上表現領先，還能提供可解釋的分析，有助於提升藥物開發效率。 PubMed DOI

M<sup>3</sup>-20M: A large-scale multi-modal molecule dataset for AI-driven drug design and discovery.
M<sup>3</sup>-20M：用於AI驅動藥物設計與發現的大規模多模態分子資料集 J Bioinform Comput Biol 2025-06-10

這篇論文推出 M³-20M 超大多模態分子資料集，收錄超過兩千萬個分子，規模比以往大71倍，結合 SMILES、2D/3D 結構、分子性質和文字描述（部分由 GPT-3.5 產生）。實驗證明，用這資料集訓練的模型在分子生成和性質預測上表現更好，對 AI 輔助藥物設計很有幫助。資料集連結：https://github.com/bz99bz/M-3 PubMed DOI

LLM-DDI: Leveraging Large Language Models for Drug-Drug Interaction Prediction on Biomedical Knowledge Graph.
LLM-DDI：運用大型語言模型於生物醫學知識圖譜進行藥物間交互作用（Drug-Drug Interaction）預測 IEEE J Biomed Health Inform 2025-07-02

這篇論文提出 LLM-DDI 模型，結合 GPT 產生的分子嵌入和圖神經網路，利用生醫知識圖譜的語意關係來預測藥物交互作用。實驗證明，LLM-DDI 在真實資料上表現比現有方法更好，對藥物開發和臨床應用很有幫助。 PubMed DOI

原始文章

站上相關主題文章列表