原始文章

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI


站上相關主題文章列表

這項研究探討了使用調校過的大型語言模型(LLMs)進行複雜化學文本挖掘任務,並在各種任務中取得了令人印象深刻的表現,僅需少量標註數據。調校過的ChatGPT模型表現優異,超越其他LLMs,展示了它們在化學知識提取的自動化數據獲取方面的潛力。 PubMed DOI

大型語言模型(LLMs)在化學領域越來越重要,能協助分子設計、性質預測和合成優化。這篇綜述探討了LLMs的能力及其自動化對科學發現的影響,還提到基於LLM的自主代理,能執行文獻擷取和與自動化實驗室互動等任務。文章也涵蓋了這些代理在其他科學領域的應用,並檢視其最新發展與挑戰,如數據質量和模型可解釋性。未來建議發展更先進的多模態代理,並改善與實驗方法的合作。欲了解更多,可參 PubMed DOI

這項研究旨在從科學文獻中有效收集金屬有機框架(MOFs)的實驗數據,以解決稀缺數據的問題,並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型,系統化提取並整理MOF數據,成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係,並創建合成條件推薦系統,為優化合成策略提供實用工具,顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI

人工智慧(AI)透過深度學習技術,特別是卷積神經網絡(CNNs),已在各領域帶來重大變革。自1990年代Yann LeCun提出以來,CNNs被廣泛應用於醫療診斷、自動駕駛、金融預測及圖像識別等。分析化學方面,深度學習提升了質譜、核磁共振等數據分析的效果。隨著大型語言模型(LLMs)如ChatGPT的興起,自然語言處理也獲得了新動力。本文探討如何利用智能手機和LLM進行激光誘導擊穿光譜(LIBS)數據的互動式分析,顯示LLMs在未來分析化學中的重要性。 PubMed DOI

這項研究探討了機器學習在預測假想晶體結構可合成性上的應用,特別是微調過的大型語言模型(LLMs)。這些模型在訓練時使用人類可讀的結構描述,表現與傳統卷積圖神經網絡相當。透過正標籤-未標籤學習模型及結構的文本嵌入表示,預測準確性更佳。此外,LLM能生成清晰的解釋,幫助化學家理解影響合成的因素,並優化無法合成的結構,協助設計新材料。 PubMed DOI

這個系統透過整合大型語言模型(LLMs)和知識圖譜,提升材料化學中聚合物科學的合成路徑識別。它解決了大分子命名的複雜性,並自動化文獻檢索、反應數據提取等任務。 主要特點包括: 1. **數據提取與結構化**:利用LLMs提取化學物質名稱,並組織成知識圖譜。 2. **逆合成路徑構建**:建立逆合成路徑樹,探索多種合成路徑。 3. **多分支反應路徑搜尋演算法(MBRPS)**:識別所有有效的多分支反應路徑,擴展逆合成規劃。 4. **聚酰亞胺合成應用**:成功生成全面的逆合成路徑樹,推薦優化路徑。 這項工作在自動化大分子逆合成規劃上有重大進展。 PubMed DOI

最近,人工智慧在分子設計上有了新進展,讓合成化學家能更輕鬆地創造特定功能的分子。雖然已有多款AI分子生成器,但使用這些工具仍需專業知識。為了解決這個問題,我們開發了ChatChemTS,一個基於大型語言模型的聊天機器人,透過簡單對話幫助設計新分子,並自動生成獎勵函數。我們的研究展示了它在設計色素和抗癌藥物方面的能力。ChatChemTS已開源,並可在GitHub上獲得,網址是 https://github.com/molecule-generator-collection/ChatChemTS。這項技術讓更多人能輕鬆使用AI進行分子設計。 PubMed DOI

作者介紹 SynLlama,一款專為小分子藥物合成路徑設計的 Llama3 微調模型。它能用常見原料和穩定反應模板,規劃出實用的合成步驟。SynLlama 資料需求低,對新原料也能應用,生成類似物和 hit expansion 表現都很優秀,是藥物化學家的實用工具。 PubMed

作者開發了 NMRExtractor 工具,能自動從論文中擷取 NMR 數據,並建立大型開放的 NMRBank 資料庫。這大幅增加可用 NMR 數據,解決公開數據不足的問題,對 AI 預測和化學研究都有很大幫助,有望加速相關領域的發展。 PubMed DOI

**重點整理:** Zhao 等人開發了 ChemDFM,一款專為化學領域設計的大型語言模型,結合了通用 AI 能力和專業化學知識。它能夠解讀光譜數據、進行數值推理,還能連結化學工具和資料庫,成為科學研究與發現的重要助手。 PubMed DOI