原始文章

研究團隊開發了 ChemBench 框架,系統性測試大型語言模型(LLMs)在化學知識與推理的表現,並和人類化學家比較。結果發現,頂尖 LLMs 平均表現甚至比專業化學家還好,但在基礎任務上仍會出錯且有時太自信。這顯示 LLMs 在化學領域很有潛力,但也有待改進,未來需加強研究和調整化學教育方式。 PubMed DOI


站上相關主題文章列表

這篇論文探討如何將領域專業知識融入提示工程,以提升大型語言模型(LLMs)在科學領域的表現。研究顯示,這種新方法在能力、準確性、F1分數及減少幻覺等指標上,表現優於傳統方法。針對MacMillan催化劑、紫杉醇和鋰鈷氧化物等複雜材料的案例研究,證實了這種方法的有效性。結果顯示,專業提示能幫助LLMs產生更準確的輸出,顯示其在科學研究中的潛在價值。論文也討論了目前方法的限制及未來研究方向。 PubMed DOI

這篇論文提出了一個評估大型語言模型(LLMs)在生物醫學知識編碼的框架,特別針對抗生素研究。框架分為三個步驟:流暢性、提示對齊和語義一致性,並評估事實知識和回應的具體性。研究涵蓋了ChatGPT、GPT-4和Llama 2等十一個模型,透過生成化合物定義和確定化合物與真菌關係的任務進行評估。結果顯示,雖然流暢性有所提升,但事實準確性仍有待加強,對LLMs作為生物醫學知識庫的可靠性提出了疑慮,並強調需要更系統的評估方法。 PubMed DOI

這項研究提出了一種新方法,結合機器學習和大型語言模型,來探索電化學 C-H 氧化反應。研究人員利用快速篩選平台評估底物,並用 LLMs 挖掘文獻數據,提升模型準確率超過 90%。此外,LLMs 生成代碼以優化反應條件,成功識別出八種藥物的高產率條件。研究還評估了十種 LLM 的表現,顯示它們在加速研究任務上的潛力,並編制了包含 1,071 種反應條件的基準數據集,為該領域提供了重要數據。 PubMed DOI

這項研究探討了微調大型語言模型(LLMs)在預測化學性質上的潛力,並指出其相較於傳統機器學習方法的優勢。研究中微調了GPT-J-6B、Llama-3.1-8B和Mistral-7B等模型,結果顯示在簡單的分類任務中,LLMs的表現通常優於傳統模型。將化學數據集轉換為LLM訓練格式相對簡單,即使是小型數據集也能有效預測。這些發現顯示,LLMs有潛力提升化學研究的實驗和計算效率,幫助研究者減少不必要的工作。 PubMed DOI

這篇教學評論探討大型語言模型(LLMs)在化學領域中,如何從非結構化的知識中提取結構化數據。傳統上,這需要大量人工和有限的自動化,但LLMs能讓非專家更有效地獲取數據。評論指出了應用LLMs的挑戰,並強調領域知識在驗證結果中的重要性。它還概述了當前的實踐,呼籲標準化指導方針,並提出將LLMs與化學專業知識結合的框架,幫助研究人員加速新化合物和材料的發現,應對社會挑戰。 PubMed DOI

ScholarChemQA 是一個新推出的學術化學問答數據集,旨在評估語言模型在化學領域的表現。這個數據集來自化學論文,問題取自論文標題,並根據摘要提供多選答案。為了應對數據不均和未標記數據的挑戰,開發了 ChemMatch 模型,能有效回答化學問題。實驗顯示,儘管大型語言模型已有進展,但在化學任務上仍有改進空間。ChemMatch 在基準測試中表現優於其他模型,顯示其有效性。更多資訊可參考 GitHub 連結:https://github.com/iriscxy/chemmatch。 PubMed DOI

大型語言模型(LLMs)在化學領域越來越重要,能協助分子設計、性質預測和合成優化。這篇綜述探討了LLMs的能力及其自動化對科學發現的影響,還提到基於LLM的自主代理,能執行文獻擷取和與自動化實驗室互動等任務。文章也涵蓋了這些代理在其他科學領域的應用,並檢視其最新發展與挑戰,如數據質量和模型可解釋性。未來建議發展更先進的多模態代理,並改善與實驗方法的合作。欲了解更多,可參 PubMed DOI

人工智慧(AI)透過深度學習技術,特別是卷積神經網絡(CNNs),已在各領域帶來重大變革。自1990年代Yann LeCun提出以來,CNNs被廣泛應用於醫療診斷、自動駕駛、金融預測及圖像識別等。分析化學方面,深度學習提升了質譜、核磁共振等數據分析的效果。隨著大型語言模型(LLMs)如ChatGPT的興起,自然語言處理也獲得了新動力。本文探討如何利用智能手機和LLM進行激光誘導擊穿光譜(LIBS)數據的互動式分析,顯示LLMs在未來分析化學中的重要性。 PubMed DOI

大型語言模型像GPT正在改變化學研究,但因化學資料有限,常出現錯誤。透過精心設計提問(prompt engineering),能減少這些錯誤並提升推理能力。雖然這方法在化學領域還不普及,但已有像電池和自動化實驗室的應用案例。總結來說,結合這兩者能讓化學研究更精確可靠。 PubMed DOI

**重點整理:** Zhao 等人開發了 ChemDFM,一款專為化學領域設計的大型語言模型,結合了通用 AI 能力和專業化學知識。它能夠解讀光譜數據、進行數值推理,還能連結化學工具和資料庫,成為科學研究與發現的重要助手。 PubMed DOI