原始文章

自動生成知識圖譜能有效提升資訊的組織性與可及性,並加速發現與創新。本研究介紹了一個利用大型語言模型在主動學習框架下創建大規模知識圖譜的流程,專注於生鮮食品、成分與化學物質的關係。透過迭代的主動學習策略,從155,260篇科學論文中提取了230,848個食品-化學成分關係,其中46%為新發現。此外,還利用鏈接預測模型發掘了355個新的食品-化學關係,顯示出強烈的發現潛力。這項研究展示了如何透過文獻進行大規模自動學習,促進實際應用的發展。 PubMed DOI


站上相關主題文章列表

討論了利用預先訓練的語言模型從文本中提取科學知識的方法,包括命名實體識別和關係提取,並在材料化學任務中展示。可從句子或段落中擷取資訊,輸出為簡單英文句子或JSON格式。這方法可直接靈活地從研究論文中建立科學知識數據庫。 PubMed DOI

小分子研究的目標是製造具有特定功能的化學物質。傳統方法著重在結構,這項研究則利用文獻資料預測功能。研究者建立了CheF數據集,收錄專利中的分子-功能對。他們發現這個文本數據集反映了化學功能,可用來預測功能。這顯示文本方法或許可成為設計新功能分子的替代途徑。 PubMed DOI

傳統的飲食評估方式可能不夠客觀且耗時,但現在有人工智慧(AI)解決方案可以自動化這個過程。這項研究使用GPT-4V模型驅動ChatGPT進行飲食評估,表現出在檢測食物和識別菜餚方面的潛力。這個方法不需要特定訓練數據,並且可以根據上下文提示來估計食物份量,提高評估的準確性。 PubMed DOI

最近,人工智慧和自動化的進展正在徹底改變催化劑的發現與設計,從傳統的試錯方法轉向更高效的高通量數位方法。這一變化主要受到高通量信息提取、自動化實驗、實時反饋和可解釋機器學習的驅動,促成了自駕實驗室的誕生,加速了材料研究的進程。近兩年,大型語言模型的興起也為這個領域帶來了更大的靈活性,改變了催化劑設計的方式,標誌著學科的革命性轉變。 PubMed DOI

人工智慧(AI)正在改變科學研究,像是蛋白質摺疊和文獻摘要等領域,但在天然產品研究中的應用卻受到限制。這主要是因為數據多樣且不平衡,分散在不同資料庫中,影響了深度學習模型的效能。為了解決這個問題,作者提議建立一個知識圖譜,整合天然產品數據,幫助開發更能模擬科學家決策過程的AI模型,並讓更多人能夠獲取這些數據,提升AI在該領域的應用。 PubMed DOI

新藥開發和不良藥物反應檢測傳統上耗時且成本高,但隨著大規模醫療數據庫和大型語言模型的興起,藥物篩選變得更有效。本研究提出一個自動化高通量藥物篩選流程,具備多項優勢,包括估算藥物與疾病的關聯、整合藥物重新利用與監測、準確解析暴露時間等。研究分析了661萬名患者的數據,發現16,901對藥物-疾病組合顯著降低風險,11,089對則顯著增加風險,顯示出潛在的藥物重新利用和安全問題。這項研究展示了自然語言處理在藥物流行病學中的潛力。 PubMed DOI

這項研究強調了數據驅動和機器學習在有機化學中的重要性,特別是在將文獻中的非結構化文本轉為結構化反應數據。這對於提升反應預測和條件建議非常關鍵。研究人員微調了一個大型語言模型,從有機合成程序中提取反應信息,並依據開放反應數據庫格式化。經過微調後,模型在生成完整記錄時達到91.25%的準確率,單個數據欄位則為92.25%。研究還探討了模型的局限性及其在特定任務上的表現。 PubMed DOI

歐洲食品安全局(EFSA)正在努力改善化學風險評估,特別是利用來自科學文獻的非結構化數據。'AI4NAMS'專案探討使用大型語言模型(LLMs),如GPT系列,來提升基於新方法論(NAMs)的數據提取與整合。針對雙酚A(BPA)的案例研究中,微調的GPT-3模型(Curie)在提取任務上表現優於現成的模型(text-davinci-002和text-davinci-003),顯示微調的效果及技術進步對模型性能的提升有顯著貢獻,進一步推動AI在科學與監管領域的應用。 PubMed DOI

準確預測ADMET(吸收、分佈、代謝、排泄和毒性)特性對藥物開發非常重要,能幫助選擇具良好藥物動力學及降低毒性的化合物。目前的ADMET數據集因樣本數量少及代表性不足而受限。為了解決這些問題,我們提出了一個多代理數據挖掘系統,利用大型語言模型識別14,401個生物測試的實驗條件,並整合不同來源的數據,最終創建了PharmaBench,包含156,618條原始條目,旨在支持藥物發現相關的AI模型開發。 PubMed DOI

這段文字探討了從文本中識別和提取關鍵資訊的重要性,特別是在食品領域,對營養師和醫生很有幫助。文中提到命名實體識別(NER)和命名實體連結(NEL)的角色。大型語言模型(如ChatGPT)為這些任務提供了新機會。作者評估了ChatGPT-3.5和ChatGPT-4在食品數據的NER和NEL表現,並比較它們在生物醫學領域的能力。結果顯示,ChatGPT在NER上表現不錯,但在實體連結的有效性上則較低。作者提醒,雖然ChatGPT有潛力,但在食品和生物醫學的關鍵決策上不應過度依賴。 PubMed DOI