原始文章

這項研究探討了生成式大型語言模型(LLMs),特別是GPT-4,在材料科學中提取帶隙數據的效果。研究將GPT-4與基於規則的ChemDataExtractor進行比較,從415篇隨機文章中提取資料。結果顯示,GPT-4的準確率達87.95%,遠超過ChemDataExtractor的51.08%。雖然GPT-4在處理複雜材料名稱上表現優異,但在準確識別帶隙值及類型方面仍有挑戰。研究強調透過錯誤分析來改善提示可提升準確性,顯示生成式LLMs在專業資訊提取上的潛力。 PubMed DOI


站上相關主題文章列表

ChatExtract 方法提出了一種簡單有效的方式,利用對話式大型語言模型(LLMs)自動從研究論文中提取數據。透過設計好的提示應用於LLM,ChatExtract 能夠確保數據正確性,同時透過後續問題來辨識和提取數據。測試結果顯示,與GPT-4等對話式LLMs相比,ChatExtract 的精確度和召回率接近90%。這種方法利用了對話模型中的信息保留、冗餘性和引入不確定性,以提高準確性。ChatExtract 在各個領域中進行數據提取有著巨大的潛力,就像在建立金屬玻璃和高熵合金數據庫時所展示的那樣。 PubMed DOI

系統性回顧很重要,但耗時。大型語言模型如GPT-4可加速,但與人類表現仍有差異。研究發現GPT-4在某些領域表現良好,但受機會和數據集影響。調整後表現下降,尤其在數據提取和篩選任務。給予提示後,在篩選文獻方面表現與人類相當。建議使用語言模型時謹慎,但在特定條件下可匹敵人類。 PubMed DOI

人工智慧工具如GPT-4在化學和材料研究中扮演重要角色。雖然GPT-4有進展,但科學界尚未廣泛使用大型語言模型。研究評估了六個開源的大型語言模型在金屬有機骨架(MOFs)研究中的表現,其中Llama2-7B和ChatGLM2-6B表現優異。高參數版本的模型表現更佳。 PubMed DOI

Transformer神經網絡,特別是大型語言模型(LLMs),在材料分析、設計和製造上很有效。它們能處理各種數據,支持工程分析,像MechGPT在材料力學領域表現出理解能力。檢索增強的本體知識圖表等策略可提高生成性能,解決困難。這些方法在材料設計探索中有優勢,並提供見解。非線性取樣和基於代理的建模增強生成能力,改進內容生成和評估。例如,問答、代碼生成和自動生成力場開發。 PubMed DOI

這個工作整合了GPT-4語言模型與機器學習演算法,建立了一個人工智慧代理人,專門應用於OFETs。透過分析科學文獻,提取實驗參數,建立了一個龐大的OFETs資料庫。透過機器學習模型評估設備性能,提出了優化方案,改善了DP-DTT OFETs的電荷傳輸性能。這項研究展示了語言模型在有機光電器件領域的應用,拓展了研究可能性。 PubMed DOI

這項研究著重評估GPT-4在生物醫學評論論文中的文本、表格和圖表生成能力,並強調一致性和抄襲問題。提出了一些建議,以增強ChatGPT在科學領域的應用,包括改進文件處理、理解複雜的生物醫學概念、精確的表格生成,以及為科學圖表設計專用模型。 PubMed DOI

ChatGPT-4是一個先進的AI模型,經過訓練後能夠產生有連貫上下文的文字。它可以回答問題,對材料科學、合成化學和藥物發現等領域有幫助。最近的研究中,ChatGPT-4成功解決了分析化學、光譜學、生物影像超分辨率和電化學等問題。儘管能夠自主完成一些任務,但較複雜的任務仍需要人類幫助。這個AI能夠生成MATLAB代碼,即使原作者未提供代碼。研究強調驗證和反饋的重要性,確保科學研究的正確性和透明度,尤其是在高級數據處理方面。 PubMed DOI

這項研究探討了微調大型語言模型(LLMs)在預測化學性質上的潛力,並指出其相較於傳統機器學習方法的優勢。研究中微調了GPT-J-6B、Llama-3.1-8B和Mistral-7B等模型,結果顯示在簡單的分類任務中,LLMs的表現通常優於傳統模型。將化學數據集轉換為LLM訓練格式相對簡單,即使是小型數據集也能有效預測。這些發現顯示,LLMs有潛力提升化學研究的實驗和計算效率,幫助研究者減少不必要的工作。 PubMed DOI

這項研究介紹了MaTableGPT,一個基於GPT的工具,專門從材料科學文獻中的表格提取數據,特別針對水分解催化劑。傳統的提取方法因表格格式多樣而不夠有效。MaTableGPT透過改進的數據表示和分割策略,提升理解能力,提取準確率高達96.8%。研究比較了零樣本、少樣本和微調學習方法,發現少樣本學習在準確性和成本上達到最佳平衡,提取準確率超過95%。此外,MaTableGPT建立的數據庫為催化劑的過電位和元素利用率提供了重要見解。 PubMed DOI

這篇論文探討大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在數據提取和呈現的有效性,並與人類策展人比較。研究聚焦於小麥和大麥的遺傳特徵,使用36篇期刊文章的資料供GrainGenes數據庫使用。主要發現包括:GPT-4在分類手稿準確率達97%,有效提取80%特徵,並顯示人類與AI合作的潛力。儘管LLMs有其限制,但在生物數據提取上仍能提供顯著幫助,使用者需謹慎對待不準確性。 PubMed DOI