原始文章

這項研究提出了一種新方法來訓練大型語言模型(LLMs)進行材料建模,解決了實驗數據不足的問題。研究者利用基於物理的訓練流程生成大量合成數據,建立穩固的初始模型,然後再用有限的實驗數據進行微調。訓練分為兩個階段:先用豐富但準確性較低的合成數據進行預訓練,再用稀缺的實驗數據微調。這種方法在聚合物可燃性指標的建模中顯示出有效性,特別是在圓錐量熱計數據不足的情況下,突顯了預訓練的重要性。 PubMed DOI


站上相關主題文章列表

這項研究探討了使用調校過的大型語言模型(LLMs)進行複雜化學文本挖掘任務,並在各種任務中取得了令人印象深刻的表現,僅需少量標註數據。調校過的ChatGPT模型表現優異,超越其他LLMs,展示了它們在化學知識提取的自動化數據獲取方面的潛力。 PubMed DOI

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI

這項研究旨在從科學文獻中有效收集金屬有機框架(MOFs)的實驗數據,以解決稀缺數據的問題,並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型,系統化提取並整理MOF數據,成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係,並創建合成條件推薦系統,為優化合成策略提供實用工具,顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI

這篇評論強調大型語言模型(LLMs)在合成生物學(SynBio)教育與研究中的重要性,特別是在生物製造領域。文章比較了美國和中國的LLMs在解決SynBio問題上的表現,並探討了它們如何從非結構化數據中提取資訊、建立知識圖譜,及促進檢索增強生成。預期LLMs將提升代謝建模和工程中的設計-建造-測試-學習(DBTL)循環,並推動自動化實驗室的發展。最後,呼籲建立LLMs的基準、發展生物安全措施,並促進相關領域專家的合作。 PubMed DOI

大型語言模型在材料科學的應用大幅推進了新材料的開發。我們提出了一個新框架,利用這些模型來優化合成特定性質的量子點材料的實驗程序。這個方法結合了合成協議生成模型和性質預測模型,並基於開源的大型語言模型進行微調,使用我們的合成數據進行訓練。 過程中,首先生成針對特定性質的合成協議,然後用性質預測模型驗證其有效性。我們的實驗中產生了六種合成協議,其中三個成功改善了多項性質,顯示出我們框架在合成規劃中的有效性及多目標優化的潛力。 PubMed DOI

這篇論文探討了一種新方法,利用AI生成內容(AIGC)模型自動化生成和審查熱力學模擬程式碼,特別針對LAMMPS軟體。提出的分子動力學代理(MDAgent)框架,透過大型語言模型簡化模擬程式的創建、執行和優化。為了微調模型,開發了針對LAMMPS的熱力學模擬程式碼數據集,專家評估顯示MDAgent顯著提升程式碼生成和審查效率,平均減少42.22%的任務時間,顯示其在材料科學中的應用潛力。 PubMed DOI

目前食品擠壓研究缺乏標準化資料集,影響進展。作者建立人工整理的資料集,並測試大型語言模型(LLMs)自動擷取文獻資料的能力。結果發現,LLMs 雖然偶有錯誤或遺漏,但能大幅減少人工整理時間,是輔助建立資料集、加速研究的有力工具。 PubMed DOI

大型語言模型像GPT正在改變化學研究,但因化學資料有限,常出現錯誤。透過精心設計提問(prompt engineering),能減少這些錯誤並提升推理能力。雖然這方法在化學領域還不普及,但已有像電池和自動化實驗室的應用案例。總結來說,結合這兩者能讓化學研究更精確可靠。 PubMed DOI

大型語言模型正帶動材料科學革新,讓自動化材料發現成真,像是資料擷取、性質預測都更有效率。不過,目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度,才能讓這些技術在實際應用上更可靠、更公平。 PubMed DOI

這項研究用大型語言模型(LLM)設計新型二氧化碳捕捉分子,並結合DFT計算篩選潛力材料。結果顯示,LLM不只產生可行分子,還提出創新設計方法,證明AI能有效輔助化學研究,提升碳捕捉材料的開發效率。 PubMed DOI