原始文章

從舊有的出版物和專利中提取化學數據面臨不少挑戰,但自動化反應挖掘提供了有效的解決方案,能將這些知識轉換為數位格式,促進材料和反應的發現。這項研究探討了使用多模態大型語言模型(MLLMs)來分析不同數據輸入,並創建了一個包含65篇文章的測試數據集。結果顯示,表現最佳的MLLM在解析反應圖和解決數據模態相互依賴性方面達到96%以上的準確率。我們開發的MERMES工具包整合了這些功能,簡化了知識提取過程,為化學知識的數位化奠定基礎。 PubMed DOI


站上相關主題文章列表

研究指出,透過提示工程引導 ChatGPT 從科學文獻中找出金屬有機骨架(MOF)的合成條件,解決虛假資訊問題。系統成功提取合成參數,精確度高,並使用機器學習模型預測 MOF 實驗結果準確率超過 87%。這方法簡化了化學數據提取整理,不需專業知識,潛力廣泛。 PubMed DOI

研究利用機器學習和自然語言處理技術,從科學文獻中提取二氧化碳電催化相關資訊。建立開源語料庫,包含基準和擴展語料庫,並開發精煉大型語言模型。目的是透過現代計算方法,促進發現新型且有效的電催化劑。 PubMed DOI

大型語言模型(LLMs)在各種任務上表現出色,但在化學領域卻遇到困難。ChemCrow是一個LLM化學智能助手,整合了專業工具和GPT-4,以增強有機合成和藥物發現等化學任務。ChemCrow能夠自主規劃合成路線並有效地引導發現,將實驗和計算化學有效地連結,促進科學進步。 PubMed DOI

預先訓練並微調的大型語言模型(LLMs)在預測無機化合物的合成可行性和選擇無機合成的前驅物方面非常有效。相較於專門的機器學習模型,微調後的LLMs表現優異,使用者需要的專業知識、成本和時間也較少。這種方法將成為未來化學機器學習研究的重要參考,同時也是實驗化學家的實用工具。 PubMed DOI

最近,人工智慧和自動化的進展正在徹底改變催化劑的發現與設計,從傳統的試錯方法轉向更高效的高通量數位方法。這一變化主要受到高通量信息提取、自動化實驗、實時反饋和可解釋機器學習的驅動,促成了自駕實驗室的誕生,加速了材料研究的進程。近兩年,大型語言模型的興起也為這個領域帶來了更大的靈活性,改變了催化劑設計的方式,標誌著學科的革命性轉變。 PubMed DOI

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI

小分子的設計對於藥物發現和能源儲存等技術應用非常重要。隨著合成化學的發展,科學界開始利用數據驅動和機器學習方法來探索設計空間。雖然生成式機器學習在分子設計上有潛力,但訓練過程複雜,且生成有效分子不易。研究顯示,預訓練的大型語言模型(LLMs)如Claude 3 Opus能根據自然語言指示創建和修改分子,達到97%的有效生成率。這些發現顯示LLMs在分子設計上具備強大潛力。 PubMed DOI

大型語言模型(LLM)技術為合成化學帶來了新機會。我們開發了一個基於LLM的反應開發框架(LLM-RDF),利用GPT-4簡化化學合成任務。這個框架包含六個專門的代理,能執行文獻搜尋、實驗設計、硬體執行等功能。我們還創建了一個網頁應用程式,讓化學家能用自然語言與自動化實驗平台互動,無需編碼技能。LLM-RDF在銅/TEMPO催化的醇類氧化反應中展現了其完整的合成開發能力,並在多種反應中證明了其廣泛適用性。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)從專利文件中提取高品質的化學反應數據,以解決人工智慧設計新分子的合成挑戰。結果顯示,這種自動化方法能增加26%的反應數據,優於以往的努力。此外,研究也指出反應挖掘中的挑戰並提出解決方案。分析顯示,先前的數據集存在不準確的問題,強調新管道在提升化學反應數據庫的數量和質量方面的潛力,未來可能促進更準確的合成預測模型。 PubMed DOI

大型語言模型(LLMs)顯著改變了自然語言處理(NLP)領域,尤其是在有機化學等專業領域。AIChemEco Inc. 開發的SynAsk是一個針對有機化學任務的LLM平台,能預測合成過程。它透過專門數據微調,並採用思考鏈方法,將知識庫與化學工具整合在問答格式中。功能包括化學知識庫、分子信息檢索、反應性能預測等,成為有機化學研究的重要工具。可至 https://synask.aichemeco.com 訪問。 PubMed DOI