原始文章

這項研究介紹了MaTableGPT,一個基於GPT的工具,專門從材料科學文獻中的表格提取數據,特別針對水分解催化劑。傳統的提取方法因表格格式多樣而不夠有效。MaTableGPT透過改進的數據表示和分割策略,提升理解能力,提取準確率高達96.8%。研究比較了零樣本、少樣本和微調學習方法,發現少樣本學習在準確性和成本上達到最佳平衡,提取準確率超過95%。此外,MaTableGPT建立的數據庫為催化劑的過電位和元素利用率提供了重要見解。 PubMed DOI


站上相關主題文章列表

隨著對能源儲存電池需求的增加,廢電池處理的環境問題也日益受到關注。有效回收貴重金屬如鎳、鈷和錳至關重要,但傳統水冶金方法常用有害化學物質。研究提出結合天然多酚作為環保沉澱劑,並利用GPT-4優化回收過程。結果顯示,單寧酸對金屬離子的沉澱率分別達94.8%、96.7%和96.7%,超越傳統方法。這一創新不僅提高效率,還促進環境可持續性,展現人工智慧與綠色化學結合的潛力。 PubMed DOI

這項研究探討了利用AI模型,特別是GPT-3、GPT-3.5和GPT-4,自動化污水流行病學文獻篩選,以提升綜合分析的效率。結果顯示,GPT-4在識別原始數據論文方面表現優異,精確度達0.96,召回率為1.00,超越目前的人工篩選標準。不過,這些模型在準確識別相關取樣地點上仍有挑戰,顯示人類監督的重要性。研究強調模型設計的謹慎性,建議AI輔助篩選能提升WBE研究效率,但仍需人類介入以確保準確性。 PubMed DOI

這項研究旨在從科學文獻中有效收集金屬有機框架(MOFs)的實驗數據,以解決稀缺數據的問題,並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型,系統化提取並整理MOF數據,成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係,並創建合成條件推薦系統,為優化合成策略提供實用工具,顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI

這項研究旨在透過自動化系統提升從科學文獻中提取藥物動力學(PK)數據的效率。研究團隊建立了一個包含2,640個專家標註表格的語料庫,並訓練了一個監督式分類流程,結合GPT-4來改善預測準確度,F1分數超過96%。該模型應用於PubMed Central的PK論文,並整合到www.pkpdai.com的搜尋工具中,代表自動化PK數據提取的重要進展,語料庫和代碼已公開。 PubMed DOI

這篇論文發現,GPT-4在系統性文獻回顧時,能準確又有效地篩選相關文章標題和摘要。在近1.2萬筆資料測試下,GPT-4在特定門檻下可達100%召回率,人工篩選時間最多可省下75%。但還需更多主題和提示詞的研究,才能確認其穩定性。 PubMed DOI

這篇研究探討不同提示設計(prompt engineering)對ChatGPT等大型語言模型,從科學文獻摘要中提取資訊準確度的影響。以白色磷光材料為例,結果顯示精心設計的提示能大幅提升模型在科學任務上的可靠性與效能,並提供實用建議給使用者參考。 PubMed DOI

這篇研究發現,用GPT-4o這類大型語言模型,只要給很少範例,就能準確從科學文獻中擷取材料性質資料,還能用資料增強法提升傳統模型表現。研究也分析了錯誤和資料品質,幫助了解實際應用時會遇到的問題。 PubMed DOI

這項研究發現,GPT-4在從小麥和大麥論文中擷取遺傳性狀資料的表現相當優異,論文分類準確率高達97%,性狀擷取率有80%,標記-性狀關聯擷取率則為61%,錯誤率也比GPT-3.5低。雖然還有進步空間,但GPT-4已展現輔助生物資料庫整理的潛力。不過,使用時仍需留意資料可能不夠完整或正確。 PubMed DOI

這項研究比較GPT-4等大型語言模型,和專為材料科學設計、經過微調的模型(如MatSciBERT、DeBERTa)在材料疲勞資料集上的命名實體辨識能力。結果顯示,針對任務微調的模型表現明顯較佳,基礎模型的上下文學習效果則高度依賴範例品質。領域預訓練對提升NER表現非常重要。 PubMed DOI

這項研究發現,客製化的ChatGPT模型在從成本效益分析論文擷取資料時,整體準確度跟現有資料庫差不多,有些變項甚至更好。不過,遇到複雜資訊(像效用值)時,表現就比較差。總結來說,AI可以幫忙自動化資料擷取,但複雜內容還是需要專家審核。 PubMed DOI