原始文章

PyEvoCell是一款新開發的儀表板,專為協助研究人員分析單細胞研究的細胞軌跡數據而設計。它結合大型語言模型(LLM),增強對Monocle3等軌跡推斷方法的分析,幫助識別細胞類型之間的生物學關聯。使用者可進行差異表達和功能分析,LLM會提供解釋,並且內建真實性過濾器,讓使用者可透過PubMed文獻驗證假設。PyEvoCell可在GitHub上免費使用,並附有安裝說明和示範數據集。欲了解更多資訊,請參考相關連結。 PubMed DOI


站上相關主題文章列表

單細胞多組學技術,特別是單細胞RNA測序(scRNA-seq),讓我們更深入了解細胞的多樣性與發展。透過將基因視為單詞,並利用word2vec技術生成基因的向量表示,我們能夠進行多尺度分析,識別細胞狀態與發展軌跡。這種方法不僅計算效率高,還能在不依賴高效能計算集群的情況下進行分析,成為探索細胞發展、基因影響及組織關係的重要工具。 PubMed DOI

功能性蛋白質組學在癌症研究中非常重要,能幫助識別新的生物標記和治療目標。我們建立了一個全面的資源,包含近8,000名癌症患者和約900個癌症細胞系的數據,並挑選了近500種高品質抗體,涵蓋主要癌症通路。為了提升可用性,我們推出了DrBioRight 2.0(https://drbioright.org),這是一個直觀的生物資訊平台,結合大型語言模型,讓研究人員能深入分析和視覺化蛋白質組學數據,加速轉化為生物醫學見解。 PubMed DOI

數據探索在定量細胞生物學中扮演著重要角色,是原始數據與科學見解之間的橋樑。與已發表的研究相比,數據探索需要靈活的方法來揭示趨勢、檢測異常值並精煉假設。這篇文章提供了實用的指導,幫助建立結構化的數據探索流程,並分享了作者在生物影像數據集上的經驗。此外,生成式人工智慧和大型語言模型的興起,使得數據處理變得更簡單。透過這些策略,研究人員能優化工作流程,得出更可靠的結論,並促進細胞生物學的數據分析合作與透明性。 PubMed DOI

STAgent 是一套自主 AI 系統,能快速分析空間轉錄體學資料,還會自動產生程式碼、解讀分布、查文獻,幾乎不用人工介入就能完成報告。應用在胰臟細胞研究時,能迅速找出關鍵機制,讓分析更快、門檻更低,為相關研究帶來新突破。 PubMed DOI

Omics 資料量暴增,超出現有分析能力,但大型語言模型(LLMs)能解決這問題。透過多模態基礎模型預訓練,可有效解析基因體、轉錄體等多元資料,應用於細胞分類、生物標記發現、基因調控等,推動 AI 驅動的生物研究,深入了解生命科學。 PubMed DOI

scDrugMap 是首個針對單細胞藥物反應預測的大型基準評測工具,支援 Python CLI 和網頁操作。它評比了 10 種模型,涵蓋 36 個資料集、超過 32 萬細胞。結果顯示 scFoundation 整體表現最佳,UCE 和 scGPT 在特定情境也很優秀。scDrugMap 平台操作簡單,對藥物開發和研究很有幫助。 PubMed

CellTypeAgent 是一款新工具,結合大型語言模型和資料庫驗證,能自動又精確地標註單細胞 RNA 定序資料的細胞類型。它比現有方法更準確、錯誤率更低,已在九個資料集、36 種組織、303 種細胞類型上測試,展現出快速又可靠的標註潛力。 PubMed

我們提出一種新方法,結合NCBI Gene的基因描述和大型語言模型,將單細胞RNA定序資料轉換成有意義的向量。做法是先找出每個細胞表現量最高的基因,擷取基因註解,再用語言模型轉成向量,並依表現量加權。這樣不只提升解釋性,也讓細胞分群和分析更精準。 PubMed

SCassist 是一款 R 套件,結合 GPT、Gemini、Llama3 等大型語言模型,協助分析單細胞 RNA 定序資料。它能自動化過濾、正規化、分群、細胞註解等流程,讓 scRNA-seq 分析更簡單好上手。詳細教學和下載可到 GitHub 查詢。 PubMed DOI

sciL-aMA 是微軟推出的新深度學習框架,結合大型語言模型的基因嵌入和單細胞 RNA 定序資料,採用 paired-VAE 架構。這方法能同時為細胞和基因建立情境感知的表徵,提升批次校正、細胞分群和基因標記鑑定的效果,兼顧效率與可解釋性。原始碼在 GitHub:https://github.com/microsoft/sciLaMA PubMed DOI