原始文章

scClassify2 是新一代細胞註解工具,能辨識細胞狀態的連續性,不只分細胞類型。它用雙層架構,結合序位迴歸和生物知識,表現優異。支援單細胞 RNA 定序和空間轉錄體學,也有提供學術用的網頁伺服器。 PubMed DOI


站上相關主題文章列表

單細胞多組學技術,特別是單細胞RNA測序(scRNA-seq),讓我們更深入了解細胞的多樣性與發展。透過將基因視為單詞,並利用word2vec技術生成基因的向量表示,我們能夠進行多尺度分析,識別細胞狀態與發展軌跡。這種方法不僅計算效率高,還能在不依賴高效能計算集群的情況下進行分析,成為探索細胞發展、基因影響及組織關係的重要工具。 PubMed DOI

這項研究探討訓練數據集的組成如何影響單細胞轉錄組學模型在人體造血中的表現。研究結果顯示: 1. 模型對新細胞類型的泛化能力較差。 2. 在健康細胞訓練集中加入惡性細胞,並不一定能改善對新惡性細胞的建模。 3. 使用胚胎幹細胞分化圖譜訓練可提升在分佈外數據任務的表現。 這些發現強調了多樣化訓練數據對開發有效單細胞模型的重要性,並提出了未來模型優化的策略。 PubMed DOI

在單細胞轉錄組學中,細胞類型註解不一致會影響數據整合與機器學習。為了解決這個問題,我們開發了統一的層級註解框架(uHAF),包含器官特定的層級細胞類型樹(uHAF-T)和大型語言模型驅動的映射工具(uHAF-Agent)。uHAF-T 提供38個器官的標準化參考,促進一致的標籤統一。uHAF-Agent 利用 GPT-4 將多樣的細胞標籤映射到 uHAF-T,簡化協調過程。這個框架增強了數據整合,支持機器學習,並促進單細胞研究的合作。uHAF 可在 https://uhaf.unifiedcellatlas.org 和 https://github.com/SuperBianC/uhaf 獲得,補充數據也可在 Bioinformatics 在線查詢。 PubMed DOI

環狀RNA(circRNA)是特殊的非編碼RNA,和多種疾病有關。準確辨識circRNA對研究和藥物開發很重要。現有方法多只用序列或生物特徵,資訊容易流失。作者提出新方法circ2LO,利用大型模型LucaOne,針對RNA剪接位點和周圍序列做進階特徵嵌入,並結合卷積層和自注意力層來抓核心特徵,最後用全連接層分類。circ2LO在人體、阿拉伯芥和小鼠資料集上表現都比現有方法好,準確又穩定,很有發展潛力。 PubMed DOI

scDrugMap 是首個針對單細胞藥物反應預測的大型基準評測工具,支援 Python CLI 和網頁操作。它評比了 10 種模型,涵蓋 36 個資料集、超過 32 萬細胞。結果顯示 scFoundation 整體表現最佳,UCE 和 scGPT 在特定情境也很優秀。scDrugMap 平台操作簡單,對藥物開發和研究很有幫助。 PubMed

CellTypeAgent 是一款新工具,結合大型語言模型和資料庫驗證,能自動又精確地標註單細胞 RNA 定序資料的細胞類型。它比現有方法更準確、錯誤率更低,已在九個資料集、36 種組織、303 種細胞類型上測試,展現出快速又可靠的標註潛力。 PubMed

這項研究開發了新型機器學習和深度學習模型,能預測15種人類細胞株中,哪些長鏈非編碼RNA在細胞質比細胞核更豐富。傳統機器學習模型表現比大型語言模型更好,AUC分數約0.71。研究團隊也提供了細胞株專屬的預測工具和網頁伺服器,方便研究人員使用。 PubMed DOI

SCassist 是一款 R 套件,結合 GPT、Gemini、Llama3 等大型語言模型,協助分析單細胞 RNA 定序資料。它能自動化過濾、正規化、分群、細胞註解等流程,讓 scRNA-seq 分析更簡單好上手。詳細教學和下載可到 GitHub 查詢。 PubMed DOI

這篇研究提出 scATD 框架,運用大型語言模型,能快速預測單細胞 RNA 定序資料的藥物敏感性。scATD 不用重新訓練模型就能準確預測新病患,靠的是創新的風格轉換和知識蒸餾技術。測試結果顯示,scATD 在準確度、泛用性和效率都比現有方法更好,還能更清楚解釋基因和藥物的關聯,對精準腫瘤醫學很有幫助。 PubMed DOI

sciL-aMA 是微軟推出的新深度學習框架,結合大型語言模型的基因嵌入和單細胞 RNA 定序資料,採用 paired-VAE 架構。這方法能同時為細胞和基因建立情境感知的表徵,提升批次校正、細胞分群和基因標記鑑定的效果,兼顧效率與可解釋性。原始碼在 GitHub:https://github.com/microsoft/sciLaMA PubMed DOI