Discovering CRISPR-Cas system with self-processing pre-crRNA capability by foundation models.
透過基礎模型發現具自我處理 pre-crRNA 能力的 CRISPR-Cas 系統。
Nat Commun 2024-11-20
CRISPR-Cas 系統的引入大幅推進了基因編輯技術。傳統上,發現 Cas 蛋白常依賴序列相似性,可能會忽略遠端同源物。隨著大型語言模型的發展,現在可以在不需大量訓練數據的情況下對 Cas 系統進行建模。我們提出的 CHOOSER 框架,能無需對齊地發現 CRISPR-Cas 系統,特別是具自我處理 pre-crRNA 能力的系統。透過 CHOOSER,我們識別出 11 個新 Casλ 同源物,顯示其在基因編輯領域的潛力。
PubMedDOI♡
站上相關主題文章列表
Large language models generate functional protein sequences across diverse families.
大型語言模型在各種家族中生成功能性蛋白質序列。
Nat Biotechnol 2023-10-03
Semantic search using protein large language models detects class II microcins in bacterial genomes.
蛋白質大型語言模型的語義搜索在細菌基因組中檢測到II類微小素。
bioRxiv 2023-12-12
ProtAgents: protein discovery <i>via</i> large language model multi-agent collaborations combining physics and machine learning.
ProtAgents: 透過結合物理學與機器學習的大型語言模型多智能體協作,進行蛋白質發現。
Digit Discov 2024-07-12