原始文章

sciL-aMA 是微軟推出的新深度學習框架,結合大型語言模型的基因嵌入和單細胞 RNA 定序資料,採用 paired-VAE 架構。這方法能同時為細胞和基因建立情境感知的表徵,提升批次校正、細胞分群和基因標記鑑定的效果,兼顧效率與可解釋性。原始碼在 GitHub:https://github.com/microsoft/sciLaMA PubMed DOI


站上相關主題文章列表

單細胞多組學技術,特別是單細胞RNA測序(scRNA-seq),讓我們更深入了解細胞的多樣性與發展。透過將基因視為單詞,並利用word2vec技術生成基因的向量表示,我們能夠進行多尺度分析,識別細胞狀態與發展軌跡。這種方法不僅計算效率高,還能在不依賴高效能計算集群的情況下進行分析,成為探索細胞發展、基因影響及組織關係的重要工具。 PubMed DOI

Omics 資料量暴增,超出現有分析能力,但大型語言模型(LLMs)能解決這問題。透過多模態基礎模型預訓練,可有效解析基因體、轉錄體等多元資料,應用於細胞分類、生物標記發現、基因調控等,推動 AI 驅動的生物研究,深入了解生命科學。 PubMed DOI

作者提出 scPEFT 方法,透過在主模型參數凍結下加上小型可訓練 adapter,讓單細胞大型語言模型(scLLMs)能用很少資料和算力快速適應新任務,且不會忘記原本知識。scPEFT 在多種生物任務表現都比 zero-shot 和傳統微調好,特別適合資源有限的研究人員推廣使用。 PubMed DOI

scDrugMap 是首個針對單細胞藥物反應預測的大型基準評測工具,支援 Python CLI 和網頁操作。它評比了 10 種模型,涵蓋 36 個資料集、超過 32 萬細胞。結果顯示 scFoundation 整體表現最佳,UCE 和 scGPT 在特定情境也很優秀。scDrugMap 平台操作簡單,對藥物開發和研究很有幫助。 PubMed

傳統基因集分析彈性有限,llm2geneset 利用大型語言模型,能根據基因和自然語言描述,動態產生專屬基因集,品質媲美甚至超越人工整理。這工具在解析高通量資料和找生物過程上,比傳統方法更有效。llm2geneset 已開源,網路上可免費取得。 PubMed DOI

大型語言模型正改變基因體醫療,能快速分析文獻和基因資料,提升診斷與治療建議的精準度。雖然還有挑戰待克服,但隨著技術進步和跨領域合作,未來 AI 將成為臨床基因體分析的主流工具,推動個人化醫療發展。 PubMed DOI

我們提出一種新方法,結合NCBI Gene的基因描述和大型語言模型,將單細胞RNA定序資料轉換成有意義的向量。做法是先找出每個細胞表現量最高的基因,擷取基因註解,再用語言模型轉成向量,並依表現量加權。這樣不只提升解釋性,也讓細胞分群和分析更精準。 PubMed

SCassist 是一款 R 套件,結合 GPT、Gemini、Llama3 等大型語言模型,協助分析單細胞 RNA 定序資料。它能自動化過濾、正規化、分群、細胞註解等流程,讓 scRNA-seq 分析更簡單好上手。詳細教學和下載可到 GitHub 查詢。 PubMed DOI

這篇研究提出 scATD 框架,運用大型語言模型,能快速預測單細胞 RNA 定序資料的藥物敏感性。scATD 不用重新訓練模型就能準確預測新病患,靠的是創新的風格轉換和知識蒸餾技術。測試結果顯示,scATD 在準確度、泛用性和效率都比現有方法更好,還能更清楚解釋基因和藥物的關聯,對精準腫瘤醫學很有幫助。 PubMed DOI

cGSA 是新一代 AI 基因集分析工具,運用大型語言模型,能針對特定疾病情境,精準排序相關路徑,減少雜訊和重複結果。實驗證明,cGSA 比傳統方法更有效,讓研究人員更容易找出有意義的生物學假說。 PubMed