單細胞和空間組學的應用在模型和病人樣本中,已經幫助識別許多新基因集,特別是在免疫療法方面。不過,這些基因集的生物學意義常常被片面解釋,因為依賴的註釋數據庫缺乏深度和準確性。為了解決這個問題,研究人員開發了免疫細胞知識圖譜(ICKGs),整合超過24,000篇文獻,並利用大型語言模型進行知識綜合。這些圖譜的質量經過獨立數據驗證,並能全面準確地註釋免疫學基因集。研究團隊還創建了一個互動網站,讓用戶能夠進行基於ICKG的基因集註釋。可透過[這個連結](https://kchen-lab.github.io/immune-knowledgegraph.github.io/)訪問。 PubMed DOI
在單細胞轉錄組學中,細胞類型註解不一致會影響數據整合與機器學習。為了解決這個問題,我們開發了統一的層級註解框架(uHAF),包含器官特定的層級細胞類型樹(uHAF-T)和大型語言模型驅動的映射工具(uHAF-Agent)。uHAF-T 提供38個器官的標準化參考,促進一致的標籤統一。uHAF-Agent 利用 GPT-4 將多樣的細胞標籤映射到 uHAF-T,簡化協調過程。這個框架增強了數據整合,支持機器學習,並促進單細胞研究的合作。uHAF 可在 https://uhaf.unifiedcellatlas.org 和 https://github.com/SuperBianC/uhaf 獲得,補充數據也可在 Bioinformatics 在線查詢。 PubMed DOI