原始文章

這篇論文提出LLM-MPP新方法,結合大型語言模型和多種分子資料(像SMILES、分子圖和文字描述),用於新藥開發。透過chain-of-thought推理、cross-attention和對比學習,有效整合多模態資訊,提升預測準確度和可解釋性。實驗結果顯示,LLM-MPP在九個資料集上表現都比現有方法更好,突破了多模態整合和可解釋性的瓶頸。 PubMed DOI


站上相關主題文章列表

LLMs如GPT和LLaMA在化學領域有潛力,尤其在用SMILES表示化學結構。研究比較後發現,LLaMA在分子性質和藥物相互作用預測上比GPT表現更好。LLaMA的SMILES嵌入在分子預測與預訓練模型相當,藥物相互作用預測更佳。這研究強調LLMs在分子嵌入有潛力,值得進一步探索。詳情請看GitHub:https://github.com/sshaghayeghs/LLaMA-VS-GPT。 PubMed DOI

小分子的設計對於藥物發現和能源儲存等技術應用非常重要。隨著合成化學的發展,科學界開始利用數據驅動和機器學習方法來探索設計空間。雖然生成式機器學習在分子設計上有潛力,但訓練過程複雜,且生成有效分子不易。研究顯示,預訓練的大型語言模型(LLMs)如Claude 3 Opus能根據自然語言指示創建和修改分子,達到97%的有效生成率。這些發現顯示LLMs在分子設計上具備強大潛力。 PubMed DOI

大型語言模型(LLMs)在藥物傳遞材料設計中展現潛力。我們使用Hugging Face的Transformers套件,透過BigBird、Gemma和GPT NeoX等架構進行預訓練和微調,並結合化學家的指導進行優化。研究結果顯示,整合化學見解對於提升模型性能至關重要。我們設計了光響應藥物傳遞分子,並探討了人類反饋在強化學習中的角色。最終,我們建立了一個高效的設計流程,但缺乏專門數據集仍是挑戰。 PubMed DOI

這篇文章探討了生成模型在分子逆向設計中的挑戰與潛力,特別是在數據稀缺的情況下如何預測特定性質的分子。傳統模型因數據有限,難以準確映射稀有但重要的分子性質。作者提出透過提供多個性質來創造獨特的映射,進而改善預測。為此,他們開發了「大型性質模型」(LPMs),這些模型基於性質到分子圖的任務訓練,並結合豐富的化學性質數據來增強訓練。文章還介紹了模型架構及案例研究,展示其有效性。 PubMed DOI

這項研究探討了微調大型語言模型(LLMs)在預測化學性質上的潛力,並指出其相較於傳統機器學習方法的優勢。研究中微調了GPT-J-6B、Llama-3.1-8B和Mistral-7B等模型,結果顯示在簡單的分類任務中,LLMs的表現通常優於傳統模型。將化學數據集轉換為LLM訓練格式相對簡單,即使是小型數據集也能有效預測。這些發現顯示,LLMs有潛力提升化學研究的實驗和計算效率,幫助研究者減少不必要的工作。 PubMed DOI

可解釋的人工智慧(XAI)是一個快速發展的領域,旨在讓機器學習模型更透明易懂。在化學領域,XAI 對於揭示分子結構與性質的關係特別重要,但現有方法多數針對專業人士,限制了普及性。 為了解決這個問題,我們提出了 XpertAI 框架,結合 XAI 技術與大型語言模型(LLMs),能夠自動生成化學數據的自然語言解釋,讓更多人能理解。 我們進行了五個案例研究,結果顯示 XpertAI 成功結合了 LLMs 和 XAI 工具,提供具體且科學準確的解釋,讓複雜的化學數據更易於理解。 PubMed DOI

這項研究探討了機器學習在預測假想晶體結構可合成性上的應用,特別是微調過的大型語言模型(LLMs)。這些模型在訓練時使用人類可讀的結構描述,表現與傳統卷積圖神經網絡相當。透過正標籤-未標籤學習模型及結構的文本嵌入表示,預測準確性更佳。此外,LLM能生成清晰的解釋,幫助化學家理解影響合成的因素,並優化無法合成的結構,協助設計新材料。 PubMed DOI

作者提出 ChemLML 這個輕量級方法,把現有的文字和分子模型結合起來,能直接從文字描述產生新分子,不用從零訓練模型,省下不少算力。分子表示法選擇很重要,SMILES 通常比 SELFIES 表現更好。作者也討論資料集問題,並證明 ChemLML 在藥物分子生成和評估上很有成效。 PubMed

XMolCap 是一套全新分子描述系統,結合分子影像、SMILES 字串和圖結構,透過多模態融合技術,能產生可解釋又精確的分子描述。它基於 BioT5 架構,並用 SwinOCSR、SciBERT、GIN-MoMu 等模型萃取特徵,表現優於現有方法,對新藥開發很有幫助。程式碼已開源,有興趣可到 GitHub 查看。 PubMed DOI

這篇研究提出GICL框架,把藥物SMILES字串的大型語言模型嵌入和分子影像結合,利用跨模態對比學習整合資訊。這種融合方式讓GICL在藥物性質預測(ADMET)上表現領先,還能提供可解釋的分析,有助於提升藥物開發效率。 PubMed DOI