Advancing materials science through next-generation machine learning.
透過下一代機器學習推進材料科學。 Curr Opin Solid State Mater Sci 2024-07-30

這段文字探討了機器學習模型的進展，特別是在電腦視覺和自然語言處理領域，像ChatGPT和Stable Diffusion等大型模型的影響。雖然在材料科學中，機器學習已在逆向設計和材料預測上取得進展，但現有模型仍過於專門，無法完全取代傳統工業流程。為了解決這個問題，建議開發一個全面的機器學習模型，能理解人類輸入並提供精確解決方案，並透過建立集中式數據集來訓練模型，以促進創新和查詢的便利性。 PubMed DOI

How Does a Generative Large Language Model Perform on Domain-Specific Information Extraction?─A Comparison between GPT-4 and a Rule-Based Method on Band Gap Extraction.
生成大型語言模型在特定領域資訊提取中的表現如何？─GPT-4與基於規則的方法在能隙提取上的比較。 J Chem Inf Model 2024-10-08

這項研究探討了生成式大型語言模型（LLMs），特別是GPT-4，在材料科學中提取帶隙數據的效果。研究將GPT-4與基於規則的ChemDataExtractor進行比較，從415篇隨機文章中提取資料。結果顯示，GPT-4的準確率達87.95%，遠超過ChemDataExtractor的51.08%。雖然GPT-4在處理複雜材料名稱上表現優異，但在準確識別帶隙值及類型方面仍有挑戰。研究強調透過錯誤分析來改善提示可提升準確性，顯示生成式LLMs在專業資訊提取上的潛力。 PubMed DOI

An ontology-based text mining dataset for extraction of process-structure-property entities.
基於本體的文本挖掘數據集，用於提取過程-結構-性質實體。 Sci Data 2024-10-13

MaterioMiner 資料集是一個重要的資源，結合了材料力學的知識與文本數據。它擁有一個連結的本體，將相關概念映射到文獻中。資料集來自四篇出版物，包含179個類別的標註，共有2,191個實體由三位評審標註，便於評估標註一致性。此外，該資料集支持材料科學中組成、過程、微結構和性質的關係表示。這項研究顯示了微調預訓練語言模型進行命名實體識別的潛力，為材料語言模型和知識圖譜的發展鋪路。 PubMed DOI

Assessment of fine-tuned large language models for real-world chemistry and material science applications.
針對現實世界化學和材料科學應用的微調大型語言模型評估。 Chem Sci 2024-12-12

這項研究探討了微調大型語言模型（LLMs）在預測化學性質上的潛力，並指出其相較於傳統機器學習方法的優勢。研究中微調了GPT-J-6B、Llama-3.1-8B和Mistral-7B等模型，結果顯示在簡單的分類任務中，LLMs的表現通常優於傳統模型。將化學數據集轉換為LLM訓練格式相對簡單，即使是小型數據集也能有效預測。這些發現顯示，LLMs有潛力提升化學研究的實驗和計算效率，幫助研究者減少不必要的工作。 PubMed DOI

Harnessing Large Language Models to Collect and Analyze Metal-Organic Framework Property Data Set.
利用大型語言模型收集和分析金屬有機框架性質數據集。 J Am Chem Soc 2025-01-21

這項研究旨在從科學文獻中有效收集金屬有機框架（MOFs）的實驗數據，以解決稀缺數據的問題，並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型，系統化提取並整理MOF數據，成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係，並創建合成條件推薦系統，為優化合成策略提供實用工具，顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI

MechBERT: Language Models for Extracting Chemical and Property Relationships about Mechanical Stress and Strain.
MechBERT：用於提取機械應力和應變的化學及性質關係的語言模型。 J Chem Inf Model 2025-01-31

語言模型正在改變材料感知的自然語言處理，透過從非結構化文本中提取豐富的上下文資訊，超越傳統的信息提取方式。小型語言模型在特定領域的問答任務中，尤其是材料科學，表現優於大型語言模型（LLMs）。我們介紹了MechBERT模型，專注於理解材料中的機械應力和應變，並利用BERT架構進行預訓練和微調。評估結果顯示，MechBERT在特定領域和一般問答任務中表現出色，且處理速度更快，數據需求更少，提升了運營效率與能源可持續性。 PubMed DOI

A Perspective on Foundation Models in Chemistry.
化學領域中 Foundation Models 的觀點 JACS Au 2025-05-02

基礎模型像 ChatGPT 這類 AI，現在也被用在化學領域，幫忙解決材料發現、結構和性質預測等難題。這些模型能克服資料不足和泛化能力差的問題，展現很大潛力。這篇綜述整理了最新進展、趨勢，還有未來在化學研究上的發展方向。 PubMed DOI

Empowering Generalist Material Intelligence with Large Language Models.
以大型語言模型賦能通用材料智能 Adv Mater 2025-05-12

大型語言模型正帶動材料科學革新，讓自動化材料發現成真，像是資料擷取、性質預測都更有效率。不過，目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度，才能讓這些技術在實際應用上更可靠、更公平。 PubMed DOI

Extracting Material Property Measurements from Scientific Literature with Limited Annotations.
從有限註解的科學文獻中擷取材料性質測量數據 J Chem Inf Model 2025-05-13

這篇研究發現，用GPT-4o這類大型語言模型，只要給很少範例，就能準確從科學文獻中擷取材料性質資料，還能用資料增強法提升傳統模型表現。研究也分析了錯誤和資料品質，幫助了解實際應用時會遇到的問題。 PubMed DOI

Annotation of biological samples data to standard ontologies with support from large language models.
結合大型語言模型輔助，將生物樣本數據註釋至標準本體的研究 Comput Struct Biotechnol J 2025-06-13

這篇研究用微調過的GPT大型語言模型，來自動把生物樣本標籤對應到本體論術語，減少人工註解負擔。實驗結果顯示，GPT模型在細胞株和細胞類型的召回率高達88–97%，但精確度只有47–64%。雖然能提升註解效率，但精確度還有進步空間，專家審查仍不可少。 PubMed DOI

原始文章

站上相關主題文章列表