原始文章

Harmonizome 3.0 是 Harmonizome 資料庫的升級版,整理了各種 omics 數據,突顯基因與其屬性之間的關聯。新版本新增 26 個數據集,總共近 1200 萬個基因-屬性關聯,並具備數據集交叉能力,能識別共享的基因模組。大型語言模型提供推測性見解,並改善了數據格式與可視化選項,使用者可下載知識圖譜並使用 UMAP 圖進行視覺化。透過互動介面,使用者能探索基因-屬性關聯,網址為 https://maayanlab.cloud/Harmonizome/。 PubMed DOI


站上相關主題文章列表

Monarch計畫整合全球開放數據,幫助瞭解基因、環境和表現型之間的關係。他們運用本體論、數據模型和知識圖支持研究轉譯。Monarch應用程式整合了不同物種的基因、表現型和疾病數據,提供API存取精心編輯的數據集和分析工具。他們改進了基礎設施、數據整合系統和用戶界面,並開發了使用OpenAI的ChatGPT進行表現型數據分析的插件。更多資訊請參考monarchinitiative.org和github.com/monarch-initiative/monarch-app。 PubMed DOI

整合生物資訊與健康記錄,革新生物醫學研究,提供全面洞察。探討不同數據整合方法,從人口生物庫到單細胞生物資訊,強調大型語言模型在數據整合中的重要性。呼籲共同努力推動精準醫學創新。 PubMed DOI

OligoM-Cancer平台的開發目的是為了解決寡轉移性癌症(OMC)的理解與治療挑戰。相較於多轉移性癌症,OMC對局部治療的反應較佳,但相關研究仍然不足,因此需要更系統的比較與個性化治療。該平台提供有關OMC的標記、診斷、預後及治療選項的全面資源,並擁有1345篇文獻和393個相關因素的資料庫。OligoM-Cancer利用現代網路技術,旨在提升數據可解釋性,增強臨床實踐,並支持大型語言模型在OMC領域的應用,促進深入分析與提高治療可靠性。 PubMed DOI

在科學研究中,隨著出版物數量的增加,管理變得愈加困難。為了解決這個問題,我們開發了一個高通量流程,利用ChatGPT從超過24,000篇秀麗隱杆線蟲和150,000篇果蠅的文獻中提取資訊,成功識別了超過200,000個C. elegans的互動及近120萬個果蠅的互動,建立了全面的生物圖譜。我們還創建了一個可搜尋的線上平台,方便使用者訪問這些知識網絡,並突顯了重要的生物途徑。這些數據庫可在worm.bio-map.com和drosophila.bio-map.com訪問。 PubMed DOI

CZ CELLxGENE Discover 是一個線上平台,專門用來探索和分析單細胞轉錄組數據。它擁有超過9300萬個獨特細胞,是目前最大的整理數據集,提供標準化數據和一致的元數據。這個平台旨在提升研究人員的可及性,讓他們能夠進行個別數據集的探索和跨資料庫的分析。透過機器學習和大型語言模型的進展,CZ CELLxGENE Discover 提供了有關健康與疾病的深入見解,特別是在單細胞層面上,並解決了龐大數據集的挑戰。 PubMed DOI

人工智慧(AI)正透過分析大型數據集來改變科學發現,尤其是在精準健康與醫學領域。不過,生物醫學數據常常零散且不一致,整合上有挑戰。為了解決這個問題,我們開發了**BioMedGraphica**,這是一個綜合平台,擁有超過300萬個實體和5600萬個關係的統一文本屬性知識圖譜,數據來自43個生物醫學數據庫。這個平台讓研究人員能進行知識發現,並以友好的介面提供與藥物、疾病等相關的豐富信息,還能創建多組學信號圖,助力新型AI模型的開發。 PubMed DOI

這篇評論探討生理學研究如何因應Omic技術的進步而轉向分子生理學,特別是蛋白質質譜分析和下一代DNA測序(NGS)。雖然這些技術提供了豐富的基因、mRNA和蛋白質數據,但要全面理解生理過程仍然困難。評論提到三種整合Omic數據與傳統研究的方法:開發線上資源、使用貝葉斯方法結合不同數據,以及應用自然語言處理技術分析文獻。此外,還提到大型語言模型(如ChatGPT)在知識整合中的角色及其局限性。 PubMed DOI

多組學研究是一種創新的生物科學方法,結合基因組學、轉錄組學、蛋白質組學和代謝組學等數據,幫助我們全面理解生物系統。這篇綜述強調數據整合的重要性,揭示生物過程中的複雜互動。 我們討論了深度學習、圖神經網絡和生成對抗網絡等計算技術的最新進展,這些技術提升了多組學數據的分析能力。同時,文章也探討了數據異質性和模型可解釋性等挑戰。 此外,大型語言模型在特徵提取和知識整合方面的潛力也被提及。儘管多組學有很大潛力,但所需的計算資源和模型調整的複雜性仍需持續創新與合作。 PubMed DOI

功能性蛋白質組學在癌症研究中非常重要,能幫助識別新的生物標記和治療目標。我們建立了一個全面的資源,包含近8,000名癌症患者和約900個癌症細胞系的數據,並挑選了近500種高品質抗體,涵蓋主要癌症通路。為了提升可用性,我們推出了DrBioRight 2.0(https://drbioright.org),這是一個直觀的生物資訊平台,結合大型語言模型,讓研究人員能深入分析和視覺化蛋白質組學數據,加速轉化為生物醫學見解。 PubMed DOI

單細胞和空間組學的應用在模型和病人樣本中,已經幫助識別許多新基因集,特別是在免疫療法方面。不過,這些基因集的生物學意義常常被片面解釋,因為依賴的註釋數據庫缺乏深度和準確性。為了解決這個問題,研究人員開發了免疫細胞知識圖譜(ICKGs),整合超過24,000篇文獻,並利用大型語言模型進行知識綜合。這些圖譜的質量經過獨立數據驗證,並能全面準確地註釋免疫學基因集。研究團隊還創建了一個互動網站,讓用戶能夠進行基於ICKG的基因集註釋。可透過[這個連結](https://kchen-lab.github.io/immune-knowledgegraph.github.io/)訪問。 PubMed DOI