原始文章

這項研究介紹了MaTableGPT,一個基於GPT的工具,專門從材料科學文獻中的表格提取數據,特別針對水分解催化劑。傳統的提取方法因表格格式多樣而不夠有效。MaTableGPT透過改進的數據表示和分割策略,提升理解能力,提取準確率高達96.8%。研究比較了零樣本、少樣本和微調學習方法,發現少樣本學習在準確性和成本上達到最佳平衡,提取準確率超過95%。此外,MaTableGPT建立的數據庫為催化劑的過電位和元素利用率提供了重要見解。 PubMed DOI


站上相關主題文章列表

自然語言處理和大型語言模型(如GPT)的進步為各個領域的研究開辟了新的可能性。在催化研究中,像ChatGPT這樣由GPT驅動的模型可以加速對催化過程的理解。科學家可以利用ChatGPT獲取洞察力,並開發創新方法來改善催化劑,就像在氧氣進化反應中一樣。 PubMed DOI

生物醫學資料庫增加快速,分析資料對生物學和醫學至關重要。現有工具常難以完整處理條目或像人類一樣修正錯誤。大型語言模型(LLMs)如ChatGPT提供了新的查詢資料庫方式,但在擴展規模時會有挑戰。ChIP-GPT是基於GPT模型Llama微調的,能高精確度從序列讀取存檔中提取元數據。它能處理打字錯誤和缺失標籤,適應各種資料庫和問題。 PubMed DOI

ChatExtract 方法提出了一種簡單有效的方式,利用對話式大型語言模型(LLMs)自動從研究論文中提取數據。透過設計好的提示應用於LLM,ChatExtract 能夠確保數據正確性,同時透過後續問題來辨識和提取數據。測試結果顯示,與GPT-4等對話式LLMs相比,ChatExtract 的精確度和召回率接近90%。這種方法利用了對話模型中的信息保留、冗餘性和引入不確定性,以提高準確性。ChatExtract 在各個領域中進行數據提取有著巨大的潛力,就像在建立金屬玻璃和高熵合金數據庫時所展示的那樣。 PubMed DOI

為了在生物醫學上更好運用奈米酶,必須設計高效能的奈米酶。先前的研究著重於提升奈米酶的活性,機器學習可協助預測活性,但數據收集和預測準確性是挑戰。研究指出,ChatGPT可協助有效收集數據,並與人合作預測奈米酶活性。梯度提升回歸(GBR)模型表現最佳。AI-ZYMES開發了一個奈米酶助手,利用ChatGPT預測奈米酶類型和活性,指導合成。奈米酶助手準確率超過90%,展現ChatGPT在奈米酶領域的新應用。 PubMed DOI

這項研究著重評估GPT-4在生物醫學評論論文中的文本、表格和圖表生成能力,並強調一致性和抄襲問題。提出了一些建議,以增強ChatGPT在科學領域的應用,包括改進文件處理、理解複雜的生物醫學概念、精確的表格生成,以及為科學圖表設計專用模型。 PubMed DOI

這項研究探討了生成式大型語言模型(LLMs),特別是GPT-4,在材料科學中提取帶隙數據的效果。研究將GPT-4與基於規則的ChemDataExtractor進行比較,從415篇隨機文章中提取資料。結果顯示,GPT-4的準確率達87.95%,遠超過ChemDataExtractor的51.08%。雖然GPT-4在處理複雜材料名稱上表現優異,但在準確識別帶隙值及類型方面仍有挑戰。研究強調透過錯誤分析來改善提示可提升準確性,顯示生成式LLMs在專業資訊提取上的潛力。 PubMed DOI

隨著對能源儲存電池需求的增加,廢電池處理的環境問題也日益受到關注。有效回收貴重金屬如鎳、鈷和錳至關重要,但傳統水冶金方法常用有害化學物質。研究提出結合天然多酚作為環保沉澱劑,並利用GPT-4優化回收過程。結果顯示,單寧酸對金屬離子的沉澱率分別達94.8%、96.7%和96.7%,超越傳統方法。這一創新不僅提高效率,還促進環境可持續性,展現人工智慧與綠色化學結合的潛力。 PubMed DOI

這項研究探討了利用AI模型,特別是GPT-3、GPT-3.5和GPT-4,自動化污水流行病學文獻篩選,以提升綜合分析的效率。結果顯示,GPT-4在識別原始數據論文方面表現優異,精確度達0.96,召回率為1.00,超越目前的人工篩選標準。不過,這些模型在準確識別相關取樣地點上仍有挑戰,顯示人類監督的重要性。研究強調模型設計的謹慎性,建議AI輔助篩選能提升WBE研究效率,但仍需人類介入以確保準確性。 PubMed DOI

這項研究旨在從科學文獻中有效收集金屬有機框架(MOFs)的實驗數據,以解決稀缺數據的問題,並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型,系統化提取並整理MOF數據,成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係,並創建合成條件推薦系統,為優化合成策略提供實用工具,顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI

這項研究旨在透過自動化系統提升從科學文獻中提取藥物動力學(PK)數據的效率。研究團隊建立了一個包含2,640個專家標註表格的語料庫,並訓練了一個監督式分類流程,結合GPT-4來改善預測準確度,F1分數超過96%。該模型應用於PubMed Central的PK論文,並整合到www.pkpdai.com的搜尋工具中,代表自動化PK數據提取的重要進展,語料庫和代碼已公開。 PubMed DOI