Extracting structured data from organic synthesis procedures using a fine-tuned large language model.
使用微調的大型語言模型從有機合成程序中提取結構化數據。 Digit Discov 2024-08-19

這項研究強調了數據驅動和機器學習在有機化學中的重要性，特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型，從有機合成程序中提取反應信息，並依據開放反應數據庫格式化。經過微調後，模型在生成完整記錄時達到91.25%的準確率，單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI

Harnessing large language models for data-scarce learning of polymer properties.
利用大型語言模型進行聚合物性質的數據稀缺學習。 Nat Comput Sci 2025-02-10

這項研究提出了一種新方法來訓練大型語言模型（LLMs）進行材料建模，解決了實驗數據不足的問題。研究者利用基於物理的訓練流程生成大量合成數據，建立穩固的初始模型，然後再用有限的實驗數據進行微調。訓練分為兩個階段：先用豐富但準確性較低的合成數據進行預訓練，再用稀缺的實驗數據微調。這種方法在聚合物可燃性指標的建模中顯示出有效性，特別是在圓錐量熱計數據不足的情況下，突顯了預訓練的重要性。 PubMed DOI

Explainable Synthesizability Prediction of Inorganic Crystal Polymorphs using Large Language Models.
使用大型語言模型進行無機晶體多型體的可解釋合成性預測。 Angew Chem Int Ed Engl 2025-02-13

這項研究探討了機器學習在預測假想晶體結構可合成性上的應用，特別是微調過的大型語言模型（LLMs）。這些模型在訓練時使用人類可讀的結構描述，表現與傳統卷積圖神經網絡相當。透過正標籤-未標籤學習模型及結構的文本嵌入表示，預測準確性更佳。此外，LLM能生成清晰的解釋，幫助化學家理解影響合成的因素，並優化無法合成的結構，協助設計新材料。 PubMed DOI

LLM-Driven Synthesis Planning for Quantum Dot Materials Development.
基於 LLM 的量子點材料開發合成規劃。 J Chem Inf Model 2025-03-12

大型語言模型在材料科學的應用大幅推進了新材料的開發。我們提出了一個新框架，利用這些模型來優化合成特定性質的量子點材料的實驗程序。這個方法結合了合成協議生成模型和性質預測模型，並基於開源的大型語言模型進行微調，使用我們的合成數據進行訓練。過程中，首先生成針對特定性質的合成協議，然後用性質預測模型驗證其有效性。我們的實驗中產生了六種合成協議，其中三個成功改善了多項性質，顯示出我們框架在合成規劃中的有效性及多目標優化的潛力。 PubMed DOI

An Evaluation of Large Language Models for Supplementing a Food Extrusion Dataset.
用於補充食品擠壓數據集之大型語言模型的評估 Foods 2025-04-26

目前食品擠壓研究缺乏標準化資料集，影響進展。作者建立人工整理的資料集，並測試大型語言模型（LLMs）自動擷取文獻資料的能力。結果發現，LLMs 雖然偶有錯誤或遺漏，但能大幅減少人工整理時間，是輔助建立資料集、加速研究的有力工具。 PubMed DOI

Empowering Generalist Material Intelligence with Large Language Models.
以大型語言模型賦能通用材料智能 Adv Mater 2025-05-12

大型語言模型正帶動材料科學革新，讓自動化材料發現成真，像是資料擷取、性質預測都更有效率。不過，目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度，才能讓這些技術在實際應用上更可靠、更公平。 PubMed DOI

Extracting Material Property Measurements from Scientific Literature with Limited Annotations.
從有限註解的科學文獻中擷取材料性質測量數據 J Chem Inf Model 2025-05-13

這篇研究發現，用GPT-4o這類大型語言模型，只要給很少範例，就能準確從科學文獻中擷取材料性質資料，還能用資料增強法提升傳統模型表現。研究也分析了錯誤和資料品質，幫助了解實際應用時會遇到的問題。 PubMed DOI

Automated literature research and review-generation method based on large language models.
基於大型語言模型的自動化文獻檢索與綜述生成方法 Natl Sci Rev 2025-06-02

這篇論文提出用大型語言模型自動產生高品質科學文獻綜述的方法，不只品質媲美人工，還能跨領域應用，使用者不用專業背景也能操作。系統有嚴格控管，產生錯誤資訊的機率極低（低於0.5%）。在催化劑研究領域測試時，能全面且可靠地整理資料。釋出的軟體讓大家一鍵就能產生綜述，大幅提升研究效率。 PubMed DOI

Designing a large language model for chemists.
為化學家設計大型語言模型 Patterns (N Y) 2025-06-09

**重點整理：** Zhao 等人開發了 ChemDFM，一款專為化學領域設計的大型語言模型，結合了通用 AI 能力和專業化學知識。它能夠解讀光譜數據、進行數值推理，還能連結化學工具和資料庫，成為科學研究與發現的重要助手。 PubMed DOI

Design of CO<sub>2</sub>-philic molecular units with large language models.
利用大型語言模型設計CO₂-philic分子單元 Chem Commun (Camb) 2025-06-11

這項研究用大型語言模型（LLM）設計新型二氧化碳捕捉分子，並結合DFT計算篩選潛力材料。結果顯示，LLM不只產生可行分子，還提出創新設計方法，證明AI能有效輔助化學研究，提升碳捕捉材料的開發效率。 PubMed DOI

原始文章

站上相關主題文章列表