Investigation of cell development and tissue structure network based on natural Language processing of scRNA-seq data.
基於 scRNA-seq 數據的自然語言處理對細胞發展和組織結構網絡的研究。 J Transl Med 2025-03-04

單細胞多組學技術，特別是單細胞RNA測序（scRNA-seq），讓我們更深入了解細胞的多樣性與發展。透過將基因視為單詞，並利用word2vec技術生成基因的向量表示，我們能夠進行多尺度分析，識別細胞狀態與發展軌跡。這種方法不僅計算效率高，還能在不依賴高效能計算集群的情況下進行分析，成為探索細胞發展、基因影響及組織關係的重要工具。 PubMed DOI

DrBioRight 2.0: an LLM-powered bioinformatics chatbot for large-scale cancer functional proteomics analysis.
DrBioRight 2.0：一個基於 LLM 的生物資訊聊天機器人，用於大規模癌症功能性蛋白質組學分析。 Nat Commun 2025-03-06

功能性蛋白質組學在癌症研究中非常重要，能幫助識別新的生物標記和治療目標。我們建立了一個全面的資源，包含近8,000名癌症患者和約900個癌症細胞系的數據，並挑選了近500種高品質抗體，涵蓋主要癌症通路。為了提升可用性，我們推出了DrBioRight 2.0（https://drbioright.org），這是一個直觀的生物資訊平台，結合大型語言模型，讓研究人員能深入分析和視覺化蛋白質組學數據，加速轉化為生物醫學見解。 PubMed DOI

Practical considerations for data exploration in quantitative cell biology.
定量細胞生物學中數據探索的實用考量。 J Cell Sci 2025-04-07

數據探索在定量細胞生物學中扮演著重要角色，是原始數據與科學見解之間的橋樑。與已發表的研究相比，數據探索需要靈活的方法來揭示趨勢、檢測異常值並精煉假設。這篇文章提供了實用的指導，幫助建立結構化的數據探索流程，並分享了作者在生物影像數據集上的經驗。此外，生成式人工智慧和大型語言模型的興起，使得數據處理變得更簡單。透過這些策略，研究人員能優化工作流程，得出更可靠的結論，並促進細胞生物學的數據分析合作與透明性。 PubMed DOI

Spatial transcriptomics AI agent charts hPSC-pancreas maturation <i>in vivo</i>.
空間轉錄體學 AI 智能代理繪製 hPSC-胰臟於體內成熟的圖譜 bioRxiv 2025-04-16

STAgent 是一套自主 AI 系統，能快速分析空間轉錄體學資料，還會自動產生程式碼、解讀分布、查文獻，幾乎不用人工介入就能完成報告。應用在胰臟細胞研究時，能迅速找出關鍵機制，讓分析更快、門檻更低，為相關研究帶來新突破。 PubMed DOI

Towards multimodal foundation models in molecular cell biology.
邁向分子細胞生物學中的多模態基礎模型 Nature 2025-04-16

Omics 資料量暴增，超出現有分析能力，但大型語言模型（LLMs）能解決這問題。透過多模態基礎模型預訓練，可有效解析基因體、轉錄體等多元資料，應用於細胞分類、生物標記發現、基因調控等，推動 AI 驅動的生物研究，深入了解生命科學。 PubMed DOI

scDrugMap: Benchmarking Large Foundation Models for Drug Response Prediction.
scDrugMap：大型基礎模型於藥物反應預測的基準評估 ArXiv 2025-05-19

scDrugMap 是首個針對單細胞藥物反應預測的大型基準評測工具，支援 Python CLI 和網頁操作。它評比了 10 種模型，涵蓋 36 個資料集、超過 32 萬細胞。結果顯示 scFoundation 整體表現最佳，UCE 和 scGPT 在特定情境也很優秀。scDrugMap 平台操作簡單，對藥物開發和研究很有幫助。 PubMed

CellTypeAgent: Trustworthy cell type annotation with Large Language Models.
CellTypeAgent：利用大型語言模型進行可信賴的細胞類型註釋 ArXiv 2025-06-04

CellTypeAgent 是一款新工具，結合大型語言模型和資料庫驗證，能自動又精確地標註單細胞 RNA 定序資料的細胞類型。它比現有方法更準確、錯誤率更低，已在九個資料集、36 種組織、303 種細胞類型上測試，展現出快速又可靠的標註潛力。 PubMed

Bridging Large Language Models and Single-Cell Transcriptomics in Dissecting Selective Motor Neuron Vulnerability.
連結大型語言模型與單細胞轉錄體學於解析選擇性運動神經元易感性的研究 ArXiv 2025-06-04

我們提出一種新方法，結合NCBI Gene的基因描述和大型語言模型，將單細胞RNA定序資料轉換成有意義的向量。做法是先找出每個細胞表現量最高的基因，擷取基因註解，再用語言模型轉成向量，並依表現量加權。這樣不只提升解釋性，也讓細胞分群和分析更精準。 PubMed

SCassist: An AI Based Workflow Assistant for Single-Cell Analysis.
SCassist：用於單細胞分析的 AI 工作流程助理 bioRxiv 2025-06-10

SCassist 是一款 R 套件，結合 GPT、Gemini、Llama3 等大型語言模型，協助分析單細胞 RNA 定序資料。它能自動化過濾、正規化、分群、細胞註解等流程，讓 scRNA-seq 分析更簡單好上手。詳細教學和下載可到 GitHub 查詢。 PubMed DOI

sciLaMA: A Single-Cell Representation Learning Framework to Leverage Prior Knowledge from Large Language Models.
sciLaMA：利用大型語言模型先驗知識的單細胞表現學習框架 bioRxiv 2025-06-12

sciL-aMA 是微軟推出的新深度學習框架，結合大型語言模型的基因嵌入和單細胞 RNA 定序資料，採用 paired-VAE 架構。這方法能同時為細胞和基因建立情境感知的表徵，提升批次校正、細胞分群和基因標記鑑定的效果，兼顧效率與可解釋性。原始碼在 GitHub：https://github.com/microsoft/sciLaMA PubMed DOI

原始文章

站上相關主題文章列表