原始文章

Harmonizome 3.0 是 Harmonizome 資料庫的升級版,整理了各種 omics 數據,突顯基因與其屬性之間的關聯。新版本新增 26 個數據集,總共近 1200 萬個基因-屬性關聯,並具備數據集交叉能力,能識別共享的基因模組。大型語言模型提供推測性見解,並改善了數據格式與可視化選項,使用者可下載知識圖譜並使用 UMAP 圖進行視覺化。透過互動介面,使用者能探索基因-屬性關聯,網址為 https://maayanlab.cloud/Harmonizome/。 PubMed DOI


站上相關主題文章列表

人工智慧(AI)正透過分析大型數據集來改變科學發現,尤其是在精準健康與醫學領域。不過,生物醫學數據常常零散且不一致,整合上有挑戰。為了解決這個問題,我們開發了**BioMedGraphica**,這是一個綜合平台,擁有超過300萬個實體和5600萬個關係的統一文本屬性知識圖譜,數據來自43個生物醫學數據庫。這個平台讓研究人員能進行知識發現,並以友好的介面提供與藥物、疾病等相關的豐富信息,還能創建多組學信號圖,助力新型AI模型的開發。 PubMed DOI

這篇評論探討生理學研究如何因應Omic技術的進步而轉向分子生理學,特別是蛋白質質譜分析和下一代DNA測序(NGS)。雖然這些技術提供了豐富的基因、mRNA和蛋白質數據,但要全面理解生理過程仍然困難。評論提到三種整合Omic數據與傳統研究的方法:開發線上資源、使用貝葉斯方法結合不同數據,以及應用自然語言處理技術分析文獻。此外,還提到大型語言模型(如ChatGPT)在知識整合中的角色及其局限性。 PubMed DOI

多組學研究是一種創新的生物科學方法,結合基因組學、轉錄組學、蛋白質組學和代謝組學等數據,幫助我們全面理解生物系統。這篇綜述強調數據整合的重要性,揭示生物過程中的複雜互動。 我們討論了深度學習、圖神經網絡和生成對抗網絡等計算技術的最新進展,這些技術提升了多組學數據的分析能力。同時,文章也探討了數據異質性和模型可解釋性等挑戰。 此外,大型語言模型在特徵提取和知識整合方面的潛力也被提及。儘管多組學有很大潛力,但所需的計算資源和模型調整的複雜性仍需持續創新與合作。 PubMed DOI

功能性蛋白質組學在癌症研究中非常重要,能幫助識別新的生物標記和治療目標。我們建立了一個全面的資源,包含近8,000名癌症患者和約900個癌症細胞系的數據,並挑選了近500種高品質抗體,涵蓋主要癌症通路。為了提升可用性,我們推出了DrBioRight 2.0(https://drbioright.org),這是一個直觀的生物資訊平台,結合大型語言模型,讓研究人員能深入分析和視覺化蛋白質組學數據,加速轉化為生物醫學見解。 PubMed DOI

單細胞和空間組學的應用在模型和病人樣本中,已經幫助識別許多新基因集,特別是在免疫療法方面。不過,這些基因集的生物學意義常常被片面解釋,因為依賴的註釋數據庫缺乏深度和準確性。為了解決這個問題,研究人員開發了免疫細胞知識圖譜(ICKGs),整合超過24,000篇文獻,並利用大型語言模型進行知識綜合。這些圖譜的質量經過獨立數據驗證,並能全面準確地註釋免疫學基因集。研究團隊還創建了一個互動網站,讓用戶能夠進行基於ICKG的基因集註釋。可透過[這個連結](https://kchen-lab.github.io/immune-knowledgegraph.github.io/)訪問。 PubMed DOI

在單細胞轉錄組學中,細胞類型註解不一致會影響數據整合與機器學習。為了解決這個問題,我們開發了統一的層級註解框架(uHAF),包含器官特定的層級細胞類型樹(uHAF-T)和大型語言模型驅動的映射工具(uHAF-Agent)。uHAF-T 提供38個器官的標準化參考,促進一致的標籤統一。uHAF-Agent 利用 GPT-4 將多樣的細胞標籤映射到 uHAF-T,簡化協調過程。這個框架增強了數據整合,支持機器學習,並促進單細胞研究的合作。uHAF 可在 https://uhaf.unifiedcellatlas.org 和 https://github.com/SuperBianC/uhaf 獲得,補充數據也可在 Bioinformatics 在線查詢。 PubMed DOI

這項研究分析了超過5,100種蛋白質在U2OS骨肉瘤細胞中的互動,繪製出人類亞細胞結構的完整地圖。研究人員透過自我監督的數據整合,找出275個分子組合,並用尺寸排除色譜法驗證結果。這項研究揭示了111個異二聚體複合體的結構,並為975種蛋白質指派了新功能,特別是在RNA處理和干擾素信號傳導中。研究還解碼了兒童癌症基因組,識別出21個反覆突變的組合,並發現102種新的癌症蛋白質。這些成果可透過Cell Visualization Portal和Mapping Toolkit獲得,成為細胞生物學的重要資源。 PubMed DOI

GeneSetCart是一個創新的網路平台,幫助研究人員管理和分析基因集,增強多組學研究的數據整合。使用者可以收集基因集,進行豐富化分析,並執行聯集、共識和交集等操作。平台提供多種可視化工具,如維恩圖和熱圖,並支援上傳多個基因集,還能搜尋PubMed文獻。獨特的基因集庫交叉功能,利用大型語言模型分析NIH計畫的基因集重疊原因。GeneSetCart特別適合沒有程式設計技能的生物學家,促進數據整合與假設生成。 PubMed DOI

這項研究開發了一套新型網絡分析工具,能整合脂質、代謝物和蛋白質等多種資料,幫助深入了解疾病機制。透過簡單易用的 R Shiny 介面,研究人員可以視覺化分子關係,並根據功能排序。應用在心血管疾病時,不只驗證已知生物標記,還發現了新的潛在標記,並揭示藥物對脂質代謝的影響,對精準醫療很有幫助。 PubMed DOI

Ontolomics-P 是一款操作簡單的網頁工具,專門分析蛋白質體學資料。它用 LDA 主題建模、GO 語意相似度和 GPT-4o 再註解,能把複雜的生物功能整理成清楚易懂的主題,還整合 10 種癌症的蛋白質資料,讓分析更全面、結果更好懂,幫助推動蛋白質體學研究。 PubMed DOI