原始文章

研究團隊開發了 ChemBench 框架,系統性測試大型語言模型(LLMs)在化學知識與推理的表現,並和人類化學家比較。結果發現,頂尖 LLMs 平均表現甚至比專業化學家還好,但在基礎任務上仍會出錯且有時太自信。這顯示 LLMs 在化學領域很有潛力,但也有待改進,未來需加強研究和調整化學教育方式。 PubMed DOI


站上相關主題文章列表

ScholarChemQA 是一個新推出的學術化學問答數據集,旨在評估語言模型在化學領域的表現。這個數據集來自化學論文,問題取自論文標題,並根據摘要提供多選答案。為了應對數據不均和未標記數據的挑戰,開發了 ChemMatch 模型,能有效回答化學問題。實驗顯示,儘管大型語言模型已有進展,但在化學任務上仍有改進空間。ChemMatch 在基準測試中表現優於其他模型,顯示其有效性。更多資訊可參考 GitHub 連結:https://github.com/iriscxy/chemmatch。 PubMed DOI

可解釋的人工智慧(XAI)是一個快速發展的領域,旨在讓機器學習模型更透明易懂。在化學領域,XAI 對於揭示分子結構與性質的關係特別重要,但現有方法多數針對專業人士,限制了普及性。 為了解決這個問題,我們提出了 XpertAI 框架,結合 XAI 技術與大型語言模型(LLMs),能夠自動生成化學數據的自然語言解釋,讓更多人能理解。 我們進行了五個案例研究,結果顯示 XpertAI 成功結合了 LLMs 和 XAI 工具,提供具體且科學準確的解釋,讓複雜的化學數據更易於理解。 PubMed DOI

大型語言模型(LLMs)在化學領域越來越重要,能協助分子設計、性質預測和合成優化。這篇綜述探討了LLMs的能力及其自動化對科學發現的影響,還提到基於LLM的自主代理,能執行文獻擷取和與自動化實驗室互動等任務。文章也涵蓋了這些代理在其他科學領域的應用,並檢視其最新發展與挑戰,如數據質量和模型可解釋性。未來建議發展更先進的多模態代理,並改善與實驗方法的合作。欲了解更多,可參 PubMed DOI

人工智慧(AI)透過深度學習技術,特別是卷積神經網絡(CNNs),已在各領域帶來重大變革。自1990年代Yann LeCun提出以來,CNNs被廣泛應用於醫療診斷、自動駕駛、金融預測及圖像識別等。分析化學方面,深度學習提升了質譜、核磁共振等數據分析的效果。隨著大型語言模型(LLMs)如ChatGPT的興起,自然語言處理也獲得了新動力。本文探討如何利用智能手機和LLM進行激光誘導擊穿光譜(LIBS)數據的互動式分析,顯示LLMs在未來分析化學中的重要性。 PubMed DOI

這項研究評估了九個大型語言模型(LLMs)在醫學領域的表現,特別是在臨床化學和實驗室管理方面。使用零-shot提示法測試109個臨床測驗,結果顯示GPT-4o的準確率最高,達81.7%,其次是GPT-4 Turbo(76.1%)和Claude 3 Opus(74.3%)。這些模型在數字和計算任務上表現優異,顯示出它們能有效運用現有知識協助醫療專業人員進行決策,未來有潛力成為醫療輔助工具。 PubMed DOI

最近,人工智慧在分子設計上有了新進展,讓合成化學家能更輕鬆地創造特定功能的分子。雖然已有多款AI分子生成器,但使用這些工具仍需專業知識。為了解決這個問題,我們開發了ChatChemTS,一個基於大型語言模型的聊天機器人,透過簡單對話幫助設計新分子,並自動生成獎勵函數。我們的研究展示了它在設計色素和抗癌藥物方面的能力。ChatChemTS已開源,並可在GitHub上獲得,網址是 https://github.com/molecule-generator-collection/ChatChemTS。這項技術讓更多人能輕鬆使用AI進行分子設計。 PubMed DOI

最近在人工智慧(AI)方面的進展,特別是大型語言模型(LLMs),正在改變醫學領域。本研究比較了四款先進的LLM聊天機器人—Claude、GPT-4、Gemini和Copilot—在生物化學課程中的表現。使用200道USMLE風格的多選題進行評估,結果顯示這些聊天機器人平均正確率為81.1%,超過學生8.3%。Claude的準確率最高,達92.5%。研究指出,這些AI模型在醫學教育中可能具備特定優勢,特別是在生物化學領域,顯示AI在醫學訓練中的潛力。 PubMed DOI

大型語言模型像GPT正在改變化學研究,但因化學資料有限,常出現錯誤。透過精心設計提問(prompt engineering),能減少這些錯誤並提升推理能力。雖然這方法在化學領域還不普及,但已有像電池和自動化實驗室的應用案例。總結來說,結合這兩者能讓化學研究更精確可靠。 PubMed DOI

大型語言模型正帶動材料科學革新,讓自動化材料發現成真,像是資料擷取、性質預測都更有效率。不過,目前還有專業知識整合不夠、資源消耗大等問題。未來要加強LLM的適應性、效率和可信度,才能讓這些技術在實際應用上更可靠、更公平。 PubMed DOI

**重點整理:** Zhao 等人開發了 ChemDFM,一款專為化學領域設計的大型語言模型,結合了通用 AI 能力和專業化學知識。它能夠解讀光譜數據、進行數值推理,還能連結化學工具和資料庫,成為科學研究與發現的重要助手。 PubMed DOI