原始文章

這項研究提出了一種新方法來訓練大型語言模型(LLMs)進行材料建模,解決了實驗數據不足的問題。研究者利用基於物理的訓練流程生成大量合成數據,建立穩固的初始模型,然後再用有限的實驗數據進行微調。訓練分為兩個階段:先用豐富但準確性較低的合成數據進行預訓練,再用稀缺的實驗數據微調。這種方法在聚合物可燃性指標的建模中顯示出有效性,特別是在圓錐量熱計數據不足的情況下,突顯了預訓練的重要性。 PubMed DOI


站上相關主題文章列表

Transformer模型可加速藥物開發和材料探索。預訓練需大量數據,但在聚合物科學等領域數據稀缺。透過數據擴增、小分子數據集和遷移學習,可克服此問題。研究指出,先在小分子上預訓練Transformer,再微調至聚合物,可達到與擴增數據集訓練相似的準確性。 PubMed DOI

研究團隊成功開發深度學習模型,將3D資訊轉換為2D SMILES字串,準確預測碳基分子的熱力學性質。模型保留結構完整性,結合等變學習模組提高預測準確性,速度更勝傳統模擬。結合機器學習與量子化學,推動能源化學領域應用,結合數據驅動與基於物理的建模,深入探索碳基分子。 PubMed DOI

預先訓練並微調的大型語言模型(LLMs)在預測無機化合物的合成可行性和選擇無機合成的前驅物方面非常有效。相較於專門的機器學習模型,微調後的LLMs表現優異,使用者需要的專業知識、成本和時間也較少。這種方法將成為未來化學機器學習研究的重要參考,同時也是實驗化學家的實用工具。 PubMed DOI

這項研究探討了使用調校過的大型語言模型(LLMs)進行複雜化學文本挖掘任務,並在各種任務中取得了令人印象深刻的表現,僅需少量標註數據。調校過的ChatGPT模型表現優異,超越其他LLMs,展示了它們在化學知識提取的自動化數據獲取方面的潛力。 PubMed DOI

小分子的設計對於藥物發現和能源儲存等技術應用非常重要。隨著合成化學的發展,科學界開始利用數據驅動和機器學習方法來探索設計空間。雖然生成式機器學習在分子設計上有潛力,但訓練過程複雜,且生成有效分子不易。研究顯示,預訓練的大型語言模型(LLMs)如Claude 3 Opus能根據自然語言指示創建和修改分子,達到97%的有效生成率。這些發現顯示LLMs在分子設計上具備強大潛力。 PubMed DOI

這篇文章探討了生成模型在分子逆向設計中的挑戰與潛力,特別是在數據稀缺的情況下如何預測特定性質的分子。傳統模型因數據有限,難以準確映射稀有但重要的分子性質。作者提出透過提供多個性質來創造獨特的映射,進而改善預測。為此,他們開發了「大型性質模型」(LPMs),這些模型基於性質到分子圖的任務訓練,並結合豐富的化學性質數據來增強訓練。文章還介紹了模型架構及案例研究,展示其有效性。 PubMed DOI

這項研究探討了微調大型語言模型(LLMs)在預測化學性質上的潛力,並指出其相較於傳統機器學習方法的優勢。研究中微調了GPT-J-6B、Llama-3.1-8B和Mistral-7B等模型,結果顯示在簡單的分類任務中,LLMs的表現通常優於傳統模型。將化學數據集轉換為LLM訓練格式相對簡單,即使是小型數據集也能有效預測。這些發現顯示,LLMs有潛力提升化學研究的實驗和計算效率,幫助研究者減少不必要的工作。 PubMed DOI

這項研究旨在從科學文獻中有效收集金屬有機框架(MOFs)的實驗數據,以解決稀缺數據的問題,並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型,系統化提取並整理MOF數據,成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係,並創建合成條件推薦系統,為優化合成策略提供實用工具,顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI

這篇評論強調大型語言模型(LLMs)在合成生物學(SynBio)教育與研究中的重要性,特別是在生物製造領域。文章比較了美國和中國的LLMs在解決SynBio問題上的表現,並探討了它們如何從非結構化數據中提取資訊、建立知識圖譜,及促進檢索增強生成。預期LLMs將提升代謝建模和工程中的設計-建造-測試-學習(DBTL)循環,並推動自動化實驗室的發展。最後,呼籲建立LLMs的基準、發展生物安全措施,並促進相關領域專家的合作。 PubMed DOI

大型語言模型在材料科學的應用大幅推進了新材料的開發。我們提出了一個新框架,利用這些模型來優化合成特定性質的量子點材料的實驗程序。這個方法結合了合成協議生成模型和性質預測模型,並基於開源的大型語言模型進行微調,使用我們的合成數據進行訓練。 過程中,首先生成針對特定性質的合成協議,然後用性質預測模型驗證其有效性。我們的實驗中產生了六種合成協議,其中三個成功改善了多項性質,顯示出我們框架在合成規劃中的有效性及多目標優化的潛力。 PubMed DOI