原始文章

PyEvoCell是一款新開發的儀表板,專為協助研究人員分析單細胞研究的細胞軌跡數據而設計。它結合大型語言模型(LLM),增強對Monocle3等軌跡推斷方法的分析,幫助識別細胞類型之間的生物學關聯。使用者可進行差異表達和功能分析,LLM會提供解釋,並且內建真實性過濾器,讓使用者可透過PubMed文獻驗證假設。PyEvoCell可在GitHub上免費使用,並附有安裝說明和示範數據集。欲了解更多資訊,請參考相關連結。 PubMed DOI


站上相關主題文章列表

單細胞测序技術革新生醫領域,但數據變異挑戰多。新scLLMs可辨識共同模式,解決問題。現有scLLMs在零-shot表現待加強,需更好適應。PEFT策略提出,改進scLLMs細胞辨識,性能提升且參數減少90%。此法有效提升單細胞模型應用效率。 PubMed DOI

BioNexusSentinel是一個用於RNA-seq和生物調控網絡探索的軟體平台,整合了視覺工具和Reactome生物模型。它包括基因表達分析器和細胞組織RNA-seq探索器,提高研究生產力,並在網絡建模和生物狀態分析中有應用。該項目在GitHub上可找到。 PubMed DOI

GENEVIC是一個由人工智慧驅動的聊天框架,旨在簡化基因數據的分析與知識發現。它能自動檢索、分析和可視化基因資訊,協助生物學家。主要功能包括生成蛋白質互作網絡、豐富基因集,並從PubMed和Google Scholar搜尋文獻。試點階段專注於阿茲海默症、精神分裂症及認知相關基因變異,幫助研究人員優先考慮重要變異。這個平台使用簡單,無需專業訓練,並在安全的HIPAA合規環境中運行,且代碼開源,促進基因研究的合作與發展。 PubMed DOI

CZ CELLxGENE Discover 是一個線上平台,專門用來探索和分析單細胞轉錄組數據。它擁有超過9300萬個獨特細胞,是目前最大的整理數據集,提供標準化數據和一致的元數據。這個平台旨在提升研究人員的可及性,讓他們能夠進行個別數據集的探索和跨資料庫的分析。透過機器學習和大型語言模型的進展,CZ CELLxGENE Discover 提供了有關健康與疾病的深入見解,特別是在單細胞層面上,並解決了龐大數據集的挑戰。 PubMed DOI

研究細胞如何對基因變化反應,對理解基因調控和性狀發展非常重要。高通量單細胞RNA測序技術提升了我們的分析能力,但仍需有效的計算模型來解釋和預測這些反應。 在此背景下,我們推出了scLAMBDA,一個深度生成學習框架,專注於建模和預測單細胞對基因擾動的反應。scLAMBDA結合大型語言模型的基因嵌入,能有效區分基線細胞狀態與擾動影響。 評估結果顯示,scLAMBDA在預測基因擾動結果上超越現有方法,準確性更高,且對新目標基因和擾動具良好泛化能力,支持多種下游分析,展現其實用性和靈活性。 PubMed DOI

空間轉錄組學是理解組織細胞組成的重要工具,尤其在癌症研究中,腫瘤微環境至關重要。然而,數據的複雜性使解釋變得困難。本研究探討大型語言模型(LLMs)在分析小鼠黑色素瘤模型的空間轉錄組數據的應用。研究發現Claude 3.5 Sonnet在斑點量化和模式識別上表現最佳,並開發出系統化工作流程,幫助分析腫瘤免疫景觀。該模型揭示了免疫抑制機制,並顯示LLMs在空間轉錄組學中的潛力,能有效提升數據解釋的能力。 PubMed DOI

單細胞多組學技術,特別是單細胞RNA測序(scRNA-seq),讓我們更深入了解細胞的多樣性與發展。透過將基因視為單詞,並利用word2vec技術生成基因的向量表示,我們能夠進行多尺度分析,識別細胞狀態與發展軌跡。這種方法不僅計算效率高,還能在不依賴高效能計算集群的情況下進行分析,成為探索細胞發展、基因影響及組織關係的重要工具。 PubMed DOI

功能性蛋白質組學在癌症研究中非常重要,能幫助識別新的生物標記和治療目標。我們建立了一個全面的資源,包含近8,000名癌症患者和約900個癌症細胞系的數據,並挑選了近500種高品質抗體,涵蓋主要癌症通路。為了提升可用性,我們推出了DrBioRight 2.0(https://drbioright.org),這是一個直觀的生物資訊平台,結合大型語言模型,讓研究人員能深入分析和視覺化蛋白質組學數據,加速轉化為生物醫學見解。 PubMed DOI

數據探索在定量細胞生物學中扮演著重要角色,是原始數據與科學見解之間的橋樑。與已發表的研究相比,數據探索需要靈活的方法來揭示趨勢、檢測異常值並精煉假設。這篇文章提供了實用的指導,幫助建立結構化的數據探索流程,並分享了作者在生物影像數據集上的經驗。此外,生成式人工智慧和大型語言模型的興起,使得數據處理變得更簡單。透過這些策略,研究人員能優化工作流程,得出更可靠的結論,並促進細胞生物學的數據分析合作與透明性。 PubMed DOI

Omics 資料量暴增,超出現有分析能力,但大型語言模型(LLMs)能解決這問題。透過多模態基礎模型預訓練,可有效解析基因體、轉錄體等多元資料,應用於細胞分類、生物標記發現、基因調控等,推動 AI 驅動的生物研究,深入了解生命科學。 PubMed DOI