原始文章

這項研究旨在從科學文獻中有效收集金屬有機框架(MOFs)的實驗數據,以解決稀缺數據的問題,並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型,系統化提取並整理MOF數據,成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係,並創建合成條件推薦系統,為優化合成策略提供實用工具,顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI


站上相關主題文章列表

人工智慧工具如GPT-4在化學和材料研究中扮演重要角色。雖然GPT-4有進展,但科學界尚未廣泛使用大型語言模型。研究評估了六個開源的大型語言模型在金屬有機骨架(MOFs)研究中的表現,其中Llama2-7B和ChatGLM2-6B表現優異。高參數版本的模型表現更佳。 PubMed DOI

ChatMOF是一個使用先進語言模型來根據文字輸入預測和生成金屬有機骨架(MOFs)的人工智慧系統。它由三個核心組件組成,在各種任務中實現高準確率。該系統展示了將大型語言模型與數據庫和機器學習結合在材料科學中實現未來進步的潛力。 PubMed DOI

預先訓練並微調的大型語言模型(LLMs)在預測無機化合物的合成可行性和選擇無機合成的前驅物方面非常有效。相較於專門的機器學習模型,微調後的LLMs表現優異,使用者需要的專業知識、成本和時間也較少。這種方法將成為未來化學機器學習研究的重要參考,同時也是實驗化學家的實用工具。 PubMed DOI

這段文字探討了機器學習模型的進展,特別是在電腦視覺和自然語言處理領域,像ChatGPT和Stable Diffusion等大型模型的影響。雖然在材料科學中,機器學習已在逆向設計和材料預測上取得進展,但現有模型仍過於專門,無法完全取代傳統工業流程。為了解決這個問題,建議開發一個全面的機器學習模型,能理解人類輸入並提供精確解決方案,並透過建立集中式數據集來訓練模型,以促進創新和查詢的便利性。 PubMed DOI

最近,人工智慧和自動化的進展正在徹底改變催化劑的發現與設計,從傳統的試錯方法轉向更高效的高通量數位方法。這一變化主要受到高通量信息提取、自動化實驗、實時反饋和可解釋機器學習的驅動,促成了自駕實驗室的誕生,加速了材料研究的進程。近兩年,大型語言模型的興起也為這個領域帶來了更大的靈活性,改變了催化劑設計的方式,標誌著學科的革命性轉變。 PubMed DOI

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)從專利文件中提取高品質的化學反應數據,以解決人工智慧設計新分子的合成挑戰。結果顯示,這種自動化方法能增加26%的反應數據,優於以往的努力。此外,研究也指出反應挖掘中的挑戰並提出解決方案。分析顯示,先前的數據集存在不準確的問題,強調新管道在提升化學反應數據庫的數量和質量方面的潛力,未來可能促進更準確的合成預測模型。 PubMed DOI

這項研究探討了微調大型語言模型(LLMs)在預測化學性質上的潛力,並指出其相較於傳統機器學習方法的優勢。研究中微調了GPT-J-6B、Llama-3.1-8B和Mistral-7B等模型,結果顯示在簡單的分類任務中,LLMs的表現通常優於傳統模型。將化學數據集轉換為LLM訓練格式相對簡單,即使是小型數據集也能有效預測。這些發現顯示,LLMs有潛力提升化學研究的實驗和計算效率,幫助研究者減少不必要的工作。 PubMed DOI

這項研究提出了一種新方法來訓練大型語言模型(LLMs)進行材料建模,解決了實驗數據不足的問題。研究者利用基於物理的訓練流程生成大量合成數據,建立穩固的初始模型,然後再用有限的實驗數據進行微調。訓練分為兩個階段:先用豐富但準確性較低的合成數據進行預訓練,再用稀缺的實驗數據微調。這種方法在聚合物可燃性指標的建模中顯示出有效性,特別是在圓錐量熱計數據不足的情況下,突顯了預訓練的重要性。 PubMed DOI

大型語言模型在材料科學的應用大幅推進了新材料的開發。我們提出了一個新框架,利用這些模型來優化合成特定性質的量子點材料的實驗程序。這個方法結合了合成協議生成模型和性質預測模型,並基於開源的大型語言模型進行微調,使用我們的合成數據進行訓練。 過程中,首先生成針對特定性質的合成協議,然後用性質預測模型驗證其有效性。我們的實驗中產生了六種合成協議,其中三個成功改善了多項性質,顯示出我們框架在合成規劃中的有效性及多目標優化的潛力。 PubMed DOI