原始文章

這個系統透過整合大型語言模型(LLMs)和知識圖譜,提升材料化學中聚合物科學的合成路徑識別。它解決了大分子命名的複雜性,並自動化文獻檢索、反應數據提取等任務。 主要特點包括: 1. **數據提取與結構化**:利用LLMs提取化學物質名稱,並組織成知識圖譜。 2. **逆合成路徑構建**:建立逆合成路徑樹,探索多種合成路徑。 3. **多分支反應路徑搜尋演算法(MBRPS)**:識別所有有效的多分支反應路徑,擴展逆合成規劃。 4. **聚酰亞胺合成應用**:成功生成全面的逆合成路徑樹,推薦優化路徑。 這項工作在自動化大分子逆合成規劃上有重大進展。 PubMed DOI


站上相關主題文章列表

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI

大型語言模型(LLMs)在化學領域越來越重要,能協助分子設計、性質預測和合成優化。這篇綜述探討了LLMs的能力及其自動化對科學發現的影響,還提到基於LLM的自主代理,能執行文獻擷取和與自動化實驗室互動等任務。文章也涵蓋了這些代理在其他科學領域的應用,並檢視其最新發展與挑戰,如數據質量和模型可解釋性。未來建議發展更先進的多模態代理,並改善與實驗方法的合作。欲了解更多,可參 PubMed DOI

這項研究旨在從科學文獻中有效收集金屬有機框架(MOFs)的實驗數據,以解決稀缺數據的問題,並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型,系統化提取並整理MOF數據,成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係,並創建合成條件推薦系統,為優化合成策略提供實用工具,顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI

這項研究探討了機器學習在預測假想晶體結構可合成性上的應用,特別是微調過的大型語言模型(LLMs)。這些模型在訓練時使用人類可讀的結構描述,表現與傳統卷積圖神經網絡相當。透過正標籤-未標籤學習模型及結構的文本嵌入表示,預測準確性更佳。此外,LLM能生成清晰的解釋,幫助化學家理解影響合成的因素,並優化無法合成的結構,協助設計新材料。 PubMed DOI

在電腦輔助合成規劃中,雖然有大量反應數據和先進演算法,但面對複雜目標如肽時,仍常遇挑戰。若能透過分層邏輯指導搜尋,明確指定不同階段的反應,這些演算法能在幾分鐘內設計出如萬古霉素和塞馬魯肽的合成路徑。雖然這些路徑不依賴文獻,但卻反映了人類專家的策略。這種方法結合保護基團策略和現實路徑定價,適用於固態或溶液模式,並利用C到N或N到C的肽延伸技術。 PubMed DOI

這篇評論強調大型語言模型(LLMs)在合成生物學(SynBio)教育與研究中的重要性,特別是在生物製造領域。文章比較了美國和中國的LLMs在解決SynBio問題上的表現,並探討了它們如何從非結構化數據中提取資訊、建立知識圖譜,及促進檢索增強生成。預期LLMs將提升代謝建模和工程中的設計-建造-測試-學習(DBTL)循環,並推動自動化實驗室的發展。最後,呼籲建立LLMs的基準、發展生物安全措施,並促進相關領域專家的合作。 PubMed DOI

大型語言模型在材料科學的應用大幅推進了新材料的開發。我們提出了一個新框架,利用這些模型來優化合成特定性質的量子點材料的實驗程序。這個方法結合了合成協議生成模型和性質預測模型,並基於開源的大型語言模型進行微調,使用我們的合成數據進行訓練。 過程中,首先生成針對特定性質的合成協議,然後用性質預測模型驗證其有效性。我們的實驗中產生了六種合成協議,其中三個成功改善了多項性質,顯示出我們框架在合成規劃中的有效性及多目標優化的潛力。 PubMed DOI

最近,人工智慧在分子設計上有了新進展,讓合成化學家能更輕鬆地創造特定功能的分子。雖然已有多款AI分子生成器,但使用這些工具仍需專業知識。為了解決這個問題,我們開發了ChatChemTS,一個基於大型語言模型的聊天機器人,透過簡單對話幫助設計新分子,並自動生成獎勵函數。我們的研究展示了它在設計色素和抗癌藥物方面的能力。ChatChemTS已開源,並可在GitHub上獲得,網址是 https://github.com/molecule-generator-collection/ChatChemTS。這項技術讓更多人能輕鬆使用AI進行分子設計。 PubMed DOI

生物合成因為環保又精準,越來越受重視。AI的加入大幅加快了生物合成的設計和優化,尤其在合成路徑規劃和酵素工程上很有幫助。即使資料有限,大型語言模型也展現潛力。不過,AI應用還有不少挑戰,未來在藥物、綠色化學等領域會更普及,但還需要持續研究突破。 PubMed DOI

作者介紹 SynLlama,一款專為小分子藥物合成路徑設計的 Llama3 微調模型。它能用常見原料和穩定反應模板,規劃出實用的合成步驟。SynLlama 資料需求低,對新原料也能應用,生成類似物和 hit expansion 表現都很優秀,是藥物化學家的實用工具。 PubMed