原始文章

這篇論文提出LLM-MPP新方法,結合大型語言模型和多種分子資料(像SMILES、分子圖和文字描述),用於新藥開發。透過chain-of-thought推理、cross-attention和對比學習,有效整合多模態資訊,提升預測準確度和可解釋性。實驗結果顯示,LLM-MPP在九個資料集上表現都比現有方法更好,突破了多模態整合和可解釋性的瓶頸。 PubMed DOI


站上相關主題文章列表

可解釋的人工智慧(XAI)是一個快速發展的領域,旨在讓機器學習模型更透明易懂。在化學領域,XAI 對於揭示分子結構與性質的關係特別重要,但現有方法多數針對專業人士,限制了普及性。 為了解決這個問題,我們提出了 XpertAI 框架,結合 XAI 技術與大型語言模型(LLMs),能夠自動生成化學數據的自然語言解釋,讓更多人能理解。 我們進行了五個案例研究,結果顯示 XpertAI 成功結合了 LLMs 和 XAI 工具,提供具體且科學準確的解釋,讓複雜的化學數據更易於理解。 PubMed DOI

這項研究探討了機器學習在預測假想晶體結構可合成性上的應用,特別是微調過的大型語言模型(LLMs)。這些模型在訓練時使用人類可讀的結構描述,表現與傳統卷積圖神經網絡相當。透過正標籤-未標籤學習模型及結構的文本嵌入表示,預測準確性更佳。此外,LLM能生成清晰的解釋,幫助化學家理解影響合成的因素,並優化無法合成的結構,協助設計新材料。 PubMed DOI

這篇文章探討了人工智慧驅動的大型語言模型(LLMs)在藥物發現與開發中的影響,特別是它們如何解決傳統方法的時間與成本問題。文章介紹了LLMs在藥物發現各階段的應用,包括藥物設計、靶點識別、驗證及相互作用分析等。此外,還提到針對藥物發現的專屬LLMs的發展及其挑戰,並展望未來人工智慧在藥物開發中的整合潛力。 PubMed DOI

作者提出 ChemLML 這個輕量級方法,把現有的文字和分子模型結合起來,能直接從文字描述產生新分子,不用從零訓練模型,省下不少算力。分子表示法選擇很重要,SMILES 通常比 SELFIES 表現更好。作者也討論資料集問題,並證明 ChemLML 在藥物分子生成和評估上很有成效。 PubMed

作者介紹 SynLlama,一款專為小分子藥物合成路徑設計的 Llama3 微調模型。它能用常見原料和穩定反應模板,規劃出實用的合成步驟。SynLlama 資料需求低,對新原料也能應用,生成類似物和 hit expansion 表現都很優秀,是藥物化學家的實用工具。 PubMed

大型語言模型正帶動材料科學革新,讓自動化材料發現成真,像是資料擷取、性質預測都更有效率。不過,目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度,才能讓這些技術在實際應用上更可靠、更公平。 PubMed DOI

XMolCap 是一套全新分子描述系統,結合分子影像、SMILES 字串和圖結構,透過多模態融合技術,能產生可解釋又精確的分子描述。它基於 BioT5 架構,並用 SwinOCSR、SciBERT、GIN-MoMu 等模型萃取特徵,表現優於現有方法,對新藥開發很有幫助。程式碼已開源,有興趣可到 GitHub 查看。 PubMed DOI

這篇研究提出GICL框架,把藥物SMILES字串的大型語言模型嵌入和分子影像結合,利用跨模態對比學習整合資訊。這種融合方式讓GICL在藥物性質預測(ADMET)上表現領先,還能提供可解釋的分析,有助於提升藥物開發效率。 PubMed DOI

這篇論文推出 M³-20M 超大多模態分子資料集,收錄超過兩千萬個分子,規模比以往大71倍,結合 SMILES、2D/3D 結構、分子性質和文字描述(部分由 GPT-3.5 產生)。實驗證明,用這資料集訓練的模型在分子生成和性質預測上表現更好,對 AI 輔助藥物設計很有幫助。資料集連結:https://github.com/bz99bz/M-3 PubMed DOI

這篇論文提出 LLM-DDI 模型,結合 GPT 產生的分子嵌入和圖神經網路,利用生醫知識圖譜的語意關係來預測藥物交互作用。實驗證明,LLM-DDI 在真實資料上表現比現有方法更好,對藥物開發和臨床應用很有幫助。 PubMed DOI