原始文章

這項研究旨在從科學文獻中有效收集金屬有機框架(MOFs)的實驗數據,以解決稀缺數據的問題,並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型,系統化提取並整理MOF數據,成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係,並創建合成條件推薦系統,為優化合成策略提供實用工具,顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI


站上相關主題文章列表

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI

這項研究提出了一種新方法來訓練大型語言模型(LLMs)進行材料建模,解決了實驗數據不足的問題。研究者利用基於物理的訓練流程生成大量合成數據,建立穩固的初始模型,然後再用有限的實驗數據進行微調。訓練分為兩個階段:先用豐富但準確性較低的合成數據進行預訓練,再用稀缺的實驗數據微調。這種方法在聚合物可燃性指標的建模中顯示出有效性,特別是在圓錐量熱計數據不足的情況下,突顯了預訓練的重要性。 PubMed DOI

這項研究探討了機器學習在預測假想晶體結構可合成性上的應用,特別是微調過的大型語言模型(LLMs)。這些模型在訓練時使用人類可讀的結構描述,表現與傳統卷積圖神經網絡相當。透過正標籤-未標籤學習模型及結構的文本嵌入表示,預測準確性更佳。此外,LLM能生成清晰的解釋,幫助化學家理解影響合成的因素,並優化無法合成的結構,協助設計新材料。 PubMed DOI

大型語言模型在材料科學的應用大幅推進了新材料的開發。我們提出了一個新框架,利用這些模型來優化合成特定性質的量子點材料的實驗程序。這個方法結合了合成協議生成模型和性質預測模型,並基於開源的大型語言模型進行微調,使用我們的合成數據進行訓練。 過程中,首先生成針對特定性質的合成協議,然後用性質預測模型驗證其有效性。我們的實驗中產生了六種合成協議,其中三個成功改善了多項性質,顯示出我們框架在合成規劃中的有效性及多目標優化的潛力。 PubMed DOI

目前食品擠壓研究缺乏標準化資料集,影響進展。作者建立人工整理的資料集,並測試大型語言模型(LLMs)自動擷取文獻資料的能力。結果發現,LLMs 雖然偶有錯誤或遺漏,但能大幅減少人工整理時間,是輔助建立資料集、加速研究的有力工具。 PubMed DOI

大型語言模型正帶動材料科學革新,讓自動化材料發現成真,像是資料擷取、性質預測都更有效率。不過,目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度,才能讓這些技術在實際應用上更可靠、更公平。 PubMed DOI

這篇研究發現,用GPT-4o這類大型語言模型,只要給很少範例,就能準確從科學文獻中擷取材料性質資料,還能用資料增強法提升傳統模型表現。研究也分析了錯誤和資料品質,幫助了解實際應用時會遇到的問題。 PubMed DOI

這篇論文提出用大型語言模型自動產生高品質科學文獻綜述的方法,不只品質媲美人工,還能跨領域應用,使用者不用專業背景也能操作。系統有嚴格控管,產生錯誤資訊的機率極低(低於0.5%)。在催化劑研究領域測試時,能全面且可靠地整理資料。釋出的軟體讓大家一鍵就能產生綜述,大幅提升研究效率。 PubMed DOI

**重點整理:** Zhao 等人開發了 ChemDFM,一款專為化學領域設計的大型語言模型,結合了通用 AI 能力和專業化學知識。它能夠解讀光譜數據、進行數值推理,還能連結化學工具和資料庫,成為科學研究與發現的重要助手。 PubMed DOI

這項研究用大型語言模型(LLM)設計新型二氧化碳捕捉分子,並結合DFT計算篩選潛力材料。結果顯示,LLM不只產生可行分子,還提出創新設計方法,證明AI能有效輔助化學研究,提升碳捕捉材料的開發效率。 PubMed DOI