原始文章

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI


站上相關主題文章列表

研究發現大型語言模型對化學有潛力,透過提示解決問題,表現不錯。最新模型在寫化學程式碼方面表現高準確。透過提示工程策略,可進一步提升準確性。研究使用的數據集和評估工具是開源的,有助未來研究。這些模型的成功可能對化學教育和研究有重大影響。 PubMed DOI

研究指出,透過提示工程引導 ChatGPT 從科學文獻中找出金屬有機骨架(MOF)的合成條件,解決虛假資訊問題。系統成功提取合成參數,精確度高,並使用機器學習模型預測 MOF 實驗結果準確率超過 87%。這方法簡化了化學數據提取整理,不需專業知識,潛力廣泛。 PubMed DOI

人工智慧在科學領域被運用,例如機器人協助化學實驗。研究人員開發了方法,將描述轉換為指令,提高效率42%。他們建立了3950個描述-指令對的數據集,加強模型的化學知識。系統能生成合成描述,顯示預先訓練模型提升人類生產力的潛力。 PubMed DOI

討論了利用預先訓練的語言模型從文本中提取科學知識的方法,包括命名實體識別和關係提取,並在材料化學任務中展示。可從句子或段落中擷取資訊,輸出為簡單英文句子或JSON格式。這方法可直接靈活地從研究論文中建立科學知識數據庫。 PubMed DOI

大型語言模型(LLMs)在各種任務上表現出色,但在化學領域卻遇到困難。ChemCrow是一個LLM化學智能助手,整合了專業工具和GPT-4,以增強有機合成和藥物發現等化學任務。ChemCrow能夠自主規劃合成路線並有效地引導發現,將實驗和計算化學有效地連結,促進科學進步。 PubMed DOI

預先訓練並微調的大型語言模型(LLMs)在預測無機化合物的合成可行性和選擇無機合成的前驅物方面非常有效。相較於專門的機器學習模型,微調後的LLMs表現優異,使用者需要的專業知識、成本和時間也較少。這種方法將成為未來化學機器學習研究的重要參考,同時也是實驗化學家的實用工具。 PubMed DOI

這項研究探討了使用調校過的大型語言模型(LLMs)進行複雜化學文本挖掘任務,並在各種任務中取得了令人印象深刻的表現,僅需少量標註數據。調校過的ChatGPT模型表現優異,超越其他LLMs,展示了它們在化學知識提取的自動化數據獲取方面的潛力。 PubMed DOI

這項研究強調了使用BERT模型進行有機材料虛擬篩選的轉移學習效果,有效解決了標記數據不足的問題。研究人員在USPTO-SMILES數據集上進行預訓練,該數據集涵蓋多樣的有機化合物和反應,並在多項篩選任務中取得了優異的R²分數,超越傳統機器學習模型。結果顯示,利用豐富的反應數據庫能進一步提升模型表現,展現機器學習在不同化學領域進行高效材料篩選的潛力。 PubMed DOI

最近,人工智慧和自動化的進展正在徹底改變催化劑的發現與設計,從傳統的試錯方法轉向更高效的高通量數位方法。這一變化主要受到高通量信息提取、自動化實驗、實時反饋和可解釋機器學習的驅動,促成了自駕實驗室的誕生,加速了材料研究的進程。近兩年,大型語言模型的興起也為這個領域帶來了更大的靈活性,改變了催化劑設計的方式,標誌著學科的革命性轉變。 PubMed DOI

小分子的設計對於藥物發現和能源儲存等技術應用非常重要。隨著合成化學的發展,科學界開始利用數據驅動和機器學習方法來探索設計空間。雖然生成式機器學習在分子設計上有潛力,但訓練過程複雜,且生成有效分子不易。研究顯示,預訓練的大型語言模型(LLMs)如Claude 3 Opus能根據自然語言指示創建和修改分子,達到97%的有效生成率。這些發現顯示LLMs在分子設計上具備強大潛力。 PubMed DOI