原始文章

基因編輯(GE)是生命科學中的重要工具,但因物種、基因序列及工具不同,編輯某些基因會遇到挑戰。為了提升基因編輯研究的設計,確認文獻中基因編輯的實踐至關重要。基因編輯元數據庫(GEM)提供了有用的資訊,但對特定基因的參與細節仍不足。 本研究開發了一種系統性方法,利用大型語言模型從GEM及相關文獻中提取關鍵資訊,讓基因編輯數據的調查更全面。我們還提出將這些資訊轉換為指標,以優先考慮未來的研究基因。最終的基因編輯資訊和評分系統旨在簡化目標基因的選擇,改善研究設計。欲了解更多,請訪問以下網址:https://github.com/szktkyk/extract_geinfo 和 https://github.com/szktkyk/visualize_geinfo。 PubMed DOI


站上相關主題文章列表

本研究使用OpenAI的GPT-4大型語言模型,評估其在功能基因組學中的應用價值。結果顯示,GPT-4能夠生成具有生物醫學知識的基因功能假設,並提供比傳統方法更豐富的資訊。這顯示大型語言模型在功能基因組學研究中具有潛力成為有用的工具。 PubMed DOI

生物醫學資料庫增加快速,分析資料對生物學和醫學至關重要。現有工具常難以完整處理條目或像人類一樣修正錯誤。大型語言模型(LLMs)如ChatGPT提供了新的查詢資料庫方式,但在擴展規模時會有挑戰。ChIP-GPT是基於GPT模型Llama微調的,能高精確度從序列讀取存檔中提取元數據。它能處理打字錯誤和缺失標籤,適應各種資料庫和問題。 PubMed DOI

GeneGPT是一種新方法,教導大型語言模型利用NCBI網站回答基因組學問題。研究顯示GeneGPT在基準任務中表現優異,得分0.83超越其他模型。研究強調GeneGPT處理多跳問題的能力,並提供改進見解。程式碼和數據可在GitHub找到。 PubMed DOI

植物基因組學有重大進展,透過高通量方法研究多種基因組範圍的分子表現型。這有助於深入了解植物特徵和遺傳機制,尤其是在模式植物物種中。為了提升作物基因組學,準確預測至關重要。AgroNT是一個大型語言模型,經過48種植物物種基因組的訓練,專注於作物物種,能進行最先進的基因組特徵預測。一項針對木薯突變的研究顯示AgroNT評估調控影響的能力。編製的數據集可作為植物基因組學中深度學習方法的參考。預先訓練的AgroNT模型可在HuggingFace上進行進一步研究。 PubMed DOI

這項研究評估了21個大型語言模型(LLMs)在檢索生物知識的有效性,特別針對基因調控和KEGG途徑。隨著生物文獻的快速增長,傳統手動整理已不再足夠,LLMs成為一個有前景的替代方案。 結果顯示,模型性能差異明顯,GPT-4和Claude-Pro在基因調控關係的F1分數分別為0.4448和0.4386,KEGG途徑的Jaccard指數也表現強勁。相比之下,開源模型表現較差。研究強調選擇合適模型的重要性,並提供了LLMs在生物研究中的應用見解,相關代碼已在GitHub上公開。 PubMed DOI

基因工程,特別是CRISPR技術的引入,徹底改變了生物醫學研究,讓精確基因修改成為可能。不過,利用這些技術需要深入了解CRISPR及其實驗背景。為此,我們提出CRISPR-GPT,這是一個結合專業知識的大型語言模型,旨在簡化基因編輯實驗設計。CRISPR-GPT能協助選擇CRISPR系統、設計引導RNA、推薦傳遞方法等,並計劃驗證實驗。我們展示了它對非專家研究者的實用性,並探討了自動化基因編輯的倫理與監管影響,強調負責任的實踐。 PubMed DOI

這項研究評估了五種大型語言模型(LLMs)在識別基因集共同功能的有效性,並探討現有基因功能數據庫的限制。結果顯示,GPT-4在73%的案例中提出的功能與整理的基因集名稱相符,且其自信度與準確性相關。相比之下,隨機基因集的零自信率高達87%。其他模型如GPT-3.5和Gemini Pro則表現不一,經常在隨機基因集上出現錯誤自信。GPT-4在分析組學數據的基因簇時,識別出共同功能的案例達45%,顯示其在特異性和基因覆蓋率上優於傳統方法,顯示LLMs在組學研究中的潛力。 PubMed DOI

大型語言模型(LLMs)正在改變生物醫學科學,特別是在理解生物序列方面。基因組語言模型(gLMs)專注於DNA序列,能幫助預測基因組中重要的功能區域、設計新DNA序列,並促進轉移學習。儘管如此,開發有效的gLMs仍面臨挑戰,如數據質量、模型架構及評估指標等。解決這些問題對於gLMs在複雜生物系統中的應用至關重要。 PubMed DOI

這段文字探討大型語言模型(LLMs)如ChatGPT在生物資訊學,特別是基因組學中的限制,提到資料檢索不佳、幻覺及序列操作錯誤等問題。為了解決這些挑戰,作者提出NagGPT作為LLMs與資料庫的橋樑,幫助精煉查詢並提高資訊準確性。此外,還介紹了Genomics Fetcher-Analyzer,這個自訂GPT能讓ChatGPT生成並執行Python程式碼,進行生物資訊學任務,並使用各種基因組資料庫的資料。整體目的是增強ChatGPT在生物資訊學的功能,提升事實準確性和遵循指示的能力。 PubMed DOI

這項研究用大型語言模型,從GEM資料庫和文獻中自動萃取基因編輯細節,突破了原本資料庫的限制。這讓研究人員能更快找到重要基因、規劃實驗,提升基因編輯研究效率。相關工具和資料已在GitHub公開,方便大家使用。 PubMed DOI