原始文章

CRISPR-Cas 系統的引入大幅推進了基因編輯技術。傳統上,發現 Cas 蛋白常依賴序列相似性,可能會忽略遠端同源物。隨著大型語言模型的發展,現在可以在不需大量訓練數據的情況下對 Cas 系統進行建模。我們提出的 CHOOSER 框架,能無需對齊地發現 CRISPR-Cas 系統,特別是具自我處理 pre-crRNA 能力的系統。透過 CHOOSER,我們識別出 11 個新 Casλ 同源物,顯示其在基因編輯領域的潛力。 PubMed DOI


站上相關主題文章列表

透過序列數據訓練的語言模型可學習蛋白質設計原則,但蛋白功能受結構影響。結合語言模型與結構資訊,可引導蛋白演化,改良抗SARS-CoV-2抗體,增強對病毒變異的中和能力。整合結構數據有助於找出有效蛋白演化路徑,無需特定訓練。 PubMed DOI

介紹了ProtAgents,一個利用大型語言模型設計新蛋白質的平台。多個人工智慧代理人合作應對複雜任務,擁有多樣能力。透過LLMs驅動的代理人合作,提供多功能蛋白質設計和分析方法。系統可設計新蛋白質、分析結構,並模擬振動頻率。自動化和協同方法可設計具特定機械性能的蛋白質,釋放解決多目標材料問題的潛力,為自主材料發現和設計鋪平道路。 PubMed DOI

基因工程,特別是CRISPR技術的引入,徹底改變了生物醫學研究,讓精確基因修改成為可能。不過,利用這些技術需要深入了解CRISPR及其實驗背景。為此,我們提出CRISPR-GPT,這是一個結合專業知識的大型語言模型,旨在簡化基因編輯實驗設計。CRISPR-GPT能協助選擇CRISPR系統、設計引導RNA、推薦傳遞方法等,並計劃驗證實驗。我們展示了它對非專家研究者的實用性,並探討了自動化基因編輯的倫理與監管影響,強調負責任的實踐。 PubMed DOI

CRISPR-Cas 系統徹底改變了合成生物學,使得精確的基因編輯成為可能。研究人員為了提升 sgRNA 活性預測的準確性,開發了深度學習模型,包括卷積神經網絡(CNN)和大型語言模型(LLM)。這些模型使用了針對酵母 *Yarrowia lipolytica* 的篩選數據進行訓練,並評估其預測高低活性 sgRNA 的能力。研究發現,將合成 sgRNA 融入不平衡數據集能顯著提升預測性能,顯示平衡訓練集在準確預測 sgRNA 活性中的重要性。 PubMed DOI

蛋白質對生物功能至關重要,而可控的蛋白質編輯技術進步讓我們能更深入探索自然系統及開發新藥物。機器學習輔助的蛋白質編輯(MLPE)雖然有潛力,但面臨組合可能性廣泛的挑戰。為此,我們提出了ProtET,透過多模態學習進行高效蛋白質編輯,並在實驗中顯示其在滿足人類期望的屬性上表現優於現有方法,特別是在穩定性方面有顯著改善。ProtET將成為推進人工蛋白質編輯的重要工具,滿足學術及產業需求。 PubMed DOI

這項研究強調了先進的大型語言模型(LLM),特別是Pro-PRIME模型,在增強結合生長激素的VHH抗體的穩定性方面的成效。考慮到蛋白質常需在極端環境中運作,研究探討了設計更高穩定性和功能性蛋白質的挑戰。經過兩輪設計,成功產生了一種突變抗體,具備更好的熱穩定性、極端pH抵抗力及更強的結合親和力。這是LLM設計的蛋白質產品首次成功應用於大規模生產,顯示其在蛋白質工程上的潛力。 PubMed DOI

傳統抗體發現方法效率低、成本高且成功率不佳。為了解決這些問題,最近引入了人工智慧(AI)技術來增強和創造新的抗體序列。本研究介紹了MAGE(單克隆抗體生成器),這是一種專門設計的蛋白質語言模型,能生成針對不同目標的人類抗體序列。MAGE已成功產生新穎且多樣的抗體,並在實驗中證實其對SARS-CoV-2、禽流感H5N1和RSV-A的結合特異性,成為針對多目標抗體設計的先驅工具。 PubMed DOI

AMP-Designer 是一種創新的方法,利用大型語言模型設計抗微生物肽 (AMPs)。在短短 11 天內,成功設計出 18 種對革蘭氏陰性菌有效的 AMP,體外測試成功率高達 94.4%。其中兩個候選者展現出強大的抗菌活性、低血毒性及在人體血漿中的穩定性,並在小鼠肺部感染研究中顯著減少細菌負荷。整個過程從設計到驗證僅需 48 天,特別適合針對特定細菌株,顯示出對抗抗生素抗藥性的潛力。 PubMed DOI

基因編輯(GE)是生命科學中的重要工具,但因物種、基因序列及工具不同,編輯某些基因會遇到挑戰。為了提升基因編輯研究的設計,確認文獻中基因編輯的實踐至關重要。基因編輯元數據庫(GEM)提供了有用的資訊,但對特定基因的參與細節仍不足。 本研究開發了一種系統性方法,利用大型語言模型從GEM及相關文獻中提取關鍵資訊,讓基因編輯數據的調查更全面。我們還提出將這些資訊轉換為指標,以優先考慮未來的研究基因。最終的基因編輯資訊和評分系統旨在簡化目標基因的選擇,改善研究設計。欲了解更多,請訪問以下網址:https://github.com/szktkyk/extract_geinfo 和 https://github.com/szktkyk/visualize_geinfo。 PubMed DOI

CRISPR-Cas9 系統雖然改變了基因組編輯,但 Cas9 的脫靶效應仍是臨床應用的挑戰。本研究評估了來自 *Faecalibaculum rodentium* 的 FrCas9 變體,並與 SpCas9 和新合成的 OpenCRISPR-1 進行比較。結果顯示,FrCas9 的目標效率優於其他兩者,且脫靶效應顯著較少。將 TREX2 與 FrCas9 融合後,能進一步減少缺失和易位,提高基因組穩定性。我們篩選了 1903 個 sgRNA,為 21 個 CGT 相關基因識別最佳 sgRNA,顯示 FrCas9 是一種高效且特異的基因編輯工具。 PubMed DOI