原始文章

研究人員用大型語言模型分析超過7萬篇植物生物學摘要,萃取出近500萬個功能性關聯,涵蓋240萬個生物實體,準確率超過85%。這些資料都整理在PlantConnectome資料庫,方便科學家查詢基因網絡、蛋白質互動和壓力反應,快速掌握最新研究。資料庫網址:https://plant.connectome.tools/ PubMed DOI


站上相關主題文章列表

基因編輯(GE)是生命科學中的重要工具,但因物種、基因序列及工具不同,編輯某些基因會遇到挑戰。為了提升基因編輯研究的設計,確認文獻中基因編輯的實踐至關重要。基因編輯元數據庫(GEM)提供了有用的資訊,但對特定基因的參與細節仍不足。 本研究開發了一種系統性方法,利用大型語言模型從GEM及相關文獻中提取關鍵資訊,讓基因編輯數據的調查更全面。我們還提出將這些資訊轉換為指標,以優先考慮未來的研究基因。最終的基因編輯資訊和評分系統旨在簡化目標基因的選擇,改善研究設計。欲了解更多,請訪問以下網址:https://github.com/szktkyk/extract_geinfo 和 https://github.com/szktkyk/visualize_geinfo。 PubMed DOI

這項研究開發了一個高通量流程,利用OpenAI的GPT模型自動從生物醫學文獻中提取基因功能資訊。研究人員針對酵母菌(Saccharomyces cerevisiae)和裂殖酵母(Schizosaccharomyces pombe)進行分析,識別出數百萬個基因功能相關的關係。結果整理成一個可搜尋的線上知識圖譜資料庫,網址為yeast.connectome.tools和spombe.connectome.tools,提供深入的互動和途徑見解,展現人工智慧與生物資訊學結合的潛力,並為其他生物系統的應用提供可擴展的方法。 PubMed DOI

這項研究分析了超過80,000篇文獻,深入探討代謝組學領域。作者利用PubMedBERT將摘要轉換為768維的嵌入向量,並透過t-SNE降維,揭示了在化學、植物生物學、藥理學及臨床診斷等領域的聚類現象。結合GPT-4o mini的主題建模,研究分為20個主題,如「植物壓力反應機制」及「COVID-19代謝組學」。時間分析顯示,自2015年後深度學習的應用增加,且對生物標記的重視持續。研究團隊還提供互動式網頁應用,方便探索這些見解,為研究人員和政策制定者提供有價值的框架。 PubMed DOI

這項研究用大型語言模型,從GEM資料庫和文獻中自動萃取基因編輯細節,突破了原本資料庫的限制。這讓研究人員能更快找到重要基因、規劃實驗,提升基因編輯研究效率。相關工具和資料已在GitHub公開,方便大家使用。 PubMed DOI

這項研究發現,大型語言模型(LLMs)能自動從文本中擷取蛋白質交互等分子資料,表現比人工處理更有效率。雖然在部分基因細節上還有困難,但整體來說,LLMs有助於加速生物知識的發現與應用。 PubMed DOI

研究團隊開發了PlantGPT,專為植物基因研究設計的AI模型,能更精確回答植物基因功能問題,錯誤率也比一般AI低。PlantGPT就像植物基因專家,已經有線上工具可用,未來也有望成為作物研究AI的參考標準。 PubMed DOI

這項研究用大型語言模型,從GEM資料庫和文獻中自動萃取、量化基因編輯資訊,突破現有資料庫限制,更清楚呈現基因在編輯中的角色,提升基因排序效率,幫助設計更好的基因編輯實驗。相關工具和資料已在GitHub公開。 PubMed DOI

大型語言模型(LLMs)在自然語言處理很強,但在植物育種的應用還有很大發展空間。這篇綜述說明LLMs能協助分析複雜生物資料、預測重要性狀,並整合基因體和環境等多元資料,有助於提升基因發現和決策效率。文章也討論目前進展、挑戰及未來展望,期望推動永續農業與糧食安全。 PubMed DOI

SeedLLM·Rice 是專為稻米研究打造的大型語言模型(7B 參數),訓練資料涵蓋全球 140 萬篇稻米文獻。它在稻米生物學任務上的表現超越 GPT-4o 等通用模型,主要因為整合了完整的稻米生物知識圖譜和創新的人類評估框架。這個模型免費開放,能協助全球稻米研究與作物改良。 PubMed DOI

BASIL DB 是一個線上知識圖譜資料庫,整理超過 43,000 篇論文,結合食物、生物活性化合物和健康效益的資訊。它用自然語言處理技術,讓使用者能互動式查詢食物與健康的關聯,對營養學和疾病預防研究很有幫助。 PubMed DOI