這項研究強調了大型語言模型(LLMs),特別是GPT-4,在提取氧化壓力相關毒理學資訊方面的潛力。研究團隊建立了一個完整的流程,從7,166篇文章中提取了17,780條記錄,識別出2,558種獨特化合物,並發現過去20年對氧化壓力的研究興趣逐漸上升。
研究編制了促氧化劑(1,416種)和抗氧化劑(1,102種)的清單,主要包括藥物、農藥和金屬等類別。結構分析顯示了特定子結構與促氧化劑和抗氧化劑的關聯。總體而言,這項研究證明了基於LLM的文本挖掘能有效建立毒理學數據庫,為未來環境與健康研究提供重要見解。
PubMed
DOI