原始文章

這項研究分析了超過5,100種蛋白質在U2OS骨肉瘤細胞中的互動,繪製出人類亞細胞結構的完整地圖。研究人員透過自我監督的數據整合,找出275個分子組合,並用尺寸排除色譜法驗證結果。這項研究揭示了111個異二聚體複合體的結構,並為975種蛋白質指派了新功能,特別是在RNA處理和干擾素信號傳導中。研究還解碼了兒童癌症基因組,識別出21個反覆突變的組合,並發現102種新的癌症蛋白質。這些成果可透過Cell Visualization Portal和Mapping Toolkit獲得,成為細胞生物學的重要資源。 PubMed DOI


站上相關主題文章列表

在分子生物學中,探索分子間的關聯性至關重要,而大型語言模型(LLMs)的出現大幅推進了這一領域。這些模型在自然語言處理和圖像生成上表現優異,能夠從龐大數據集中捕捉複雜關係,成為基礎模型。 目前的數據集涵蓋RNA、DNA、蛋白質序列及單細胞和空間轉錄組,為模型開發提供了豐富基礎。未來,基礎模型的發展將專注於提升可解釋性、整合多組學數據及增強預測能力,對於改進我們對生物系統的理解及治療策略具有巨大潛力。 PubMed DOI

Harmonizome 3.0 是 Harmonizome 資料庫的升級版,整理了各種 omics 數據,突顯基因與其屬性之間的關聯。新版本新增 26 個數據集,總共近 1200 萬個基因-屬性關聯,並具備數據集交叉能力,能識別共享的基因模組。大型語言模型提供推測性見解,並改善了數據格式與可視化選項,使用者可下載知識圖譜並使用 UMAP 圖進行視覺化。透過互動介面,使用者能探索基因-屬性關聯,網址為 https://maayanlab.cloud/Harmonizome/。 PubMed DOI

這項研究探討了腎小球中特定細胞的分子特徵,結合了基質輔助雷射脫附/電離成像質譜(MALDI IMS)和多重免疫螢光(MxIF)技術。重點在於了解這些特徵在疾病,特別是糖尿病腎病中足細胞喪失的變化。研究揭示了腎小球內脂質的異質性,並利用機器學習技術進行細胞類型的識別,促進了與腎小球細胞及其微環境的分子標記發現。這些成果對於理解腎臟疾病具有重要意義。 PubMed DOI

CZ CELLxGENE Discover 是一個線上平台,專門用來探索和分析單細胞轉錄組數據。它擁有超過9300萬個獨特細胞,是目前最大的整理數據集,提供標準化數據和一致的元數據。這個平台旨在提升研究人員的可及性,讓他們能夠進行個別數據集的探索和跨資料庫的分析。透過機器學習和大型語言模型的進展,CZ CELLxGENE Discover 提供了有關健康與疾病的深入見解,特別是在單細胞層面上,並解決了龐大數據集的挑戰。 PubMed DOI

空間轉錄組學是理解組織細胞組成的重要工具,尤其在癌症研究中,腫瘤微環境至關重要。然而,數據的複雜性使解釋變得困難。本研究探討大型語言模型(LLMs)在分析小鼠黑色素瘤模型的空間轉錄組數據的應用。研究發現Claude 3.5 Sonnet在斑點量化和模式識別上表現最佳,並開發出系統化工作流程,幫助分析腫瘤免疫景觀。該模型揭示了免疫抑制機制,並顯示LLMs在空間轉錄組學中的潛力,能有效提升數據解釋的能力。 PubMed DOI

單細胞多組學技術,特別是單細胞RNA測序(scRNA-seq),讓我們更深入了解細胞的多樣性與發展。透過將基因視為單詞,並利用word2vec技術生成基因的向量表示,我們能夠進行多尺度分析,識別細胞狀態與發展軌跡。這種方法不僅計算效率高,還能在不依賴高效能計算集群的情況下進行分析,成為探索細胞發展、基因影響及組織關係的重要工具。 PubMed DOI

單細胞和空間組學的應用在模型和病人樣本中,已經幫助識別許多新基因集,特別是在免疫療法方面。不過,這些基因集的生物學意義常常被片面解釋,因為依賴的註釋數據庫缺乏深度和準確性。為了解決這個問題,研究人員開發了免疫細胞知識圖譜(ICKGs),整合超過24,000篇文獻,並利用大型語言模型進行知識綜合。這些圖譜的質量經過獨立數據驗證,並能全面準確地註釋免疫學基因集。研究團隊還創建了一個互動網站,讓用戶能夠進行基於ICKG的基因集註釋。可透過[這個連結](https://kchen-lab.github.io/immune-knowledgegraph.github.io/)訪問。 PubMed DOI

在單細胞轉錄組學中,細胞類型註解不一致會影響數據整合與機器學習。為了解決這個問題,我們開發了統一的層級註解框架(uHAF),包含器官特定的層級細胞類型樹(uHAF-T)和大型語言模型驅動的映射工具(uHAF-Agent)。uHAF-T 提供38個器官的標準化參考,促進一致的標籤統一。uHAF-Agent 利用 GPT-4 將多樣的細胞標籤映射到 uHAF-T,簡化協調過程。這個框架增強了數據整合,支持機器學習,並促進單細胞研究的合作。uHAF 可在 https://uhaf.unifiedcellatlas.org 和 https://github.com/SuperBianC/uhaf 獲得,補充數據也可在 Bioinformatics 在線查詢。 PubMed DOI

Omics 資料量暴增,超出現有分析能力,但大型語言模型(LLMs)能解決這問題。透過多模態基礎模型預訓練,可有效解析基因體、轉錄體等多元資料,應用於細胞分類、生物標記發現、基因調控等,推動 AI 驅動的生物研究,深入了解生命科學。 PubMed DOI

現代多模態影像技術,像是質譜影像(MSI),讓我們能更精確地看出組織內各種分子的分布。結合MSI和其他分析方法,有助於深入了解細胞差異和疾病機制,對精準醫療發展很有幫助。 PubMed DOI