原始文章

Harmonizome 3.0 是 Harmonizome 資料庫的升級版,整理了各種 omics 數據,突顯基因與其屬性之間的關聯。新版本新增 26 個數據集,總共近 1200 萬個基因-屬性關聯,並具備數據集交叉能力,能識別共享的基因模組。大型語言模型提供推測性見解,並改善了數據格式與可視化選項,使用者可下載知識圖譜並使用 UMAP 圖進行視覺化。透過互動介面,使用者能探索基因-屬性關聯,網址為 https://maayanlab.cloud/Harmonizome/。 PubMed DOI


站上相關主題文章列表

分子生物學家常用統計豐富分析研究基因列表,了解基因生物功能。新方法SPINDOCTOR利用大型語言模型(LLMs)如GPT總結基因集功能,不需Gene Ontology等知識庫。雖然SPINDOCTOR能生成符合生物學要求的基因功能摘要,但在提供可靠統計分數方面有困難,可能無法像標準豐富分析那樣精確。結果顯示,仍需手動編輯本體信息,LLM方法尚未完全取代傳統分析技術。 PubMed DOI

Monarch計畫整合全球開放數據,幫助瞭解基因、環境和表現型之間的關係。他們運用本體論、數據模型和知識圖支持研究轉譯。Monarch應用程式整合了不同物種的基因、表現型和疾病數據,提供API存取精心編輯的數據集和分析工具。他們改進了基礎設施、數據整合系統和用戶界面,並開發了使用OpenAI的ChatGPT進行表現型數據分析的插件。更多資訊請參考monarchinitiative.org和github.com/monarch-initiative/monarch-app。 PubMed DOI

腎髓在維持鹽分和水分平衡方面扮演著關鍵角色,但由於其對氧氣的高需求,容易受到失調的影響。獲取高質量的組織樣本一直是阻礙我們理解腎髓分子過程的問題。Haug等人使用各種技術來識別腎髓組織中的標記基因,揭示了其在腎臟健康中的功能。他們的研究展示了整合多種數據進行全面分析的威力。 PubMed DOI

整合生物資訊與健康記錄,革新生物醫學研究,提供全面洞察。探討不同數據整合方法,從人口生物庫到單細胞生物資訊,強調大型語言模型在數據整合中的重要性。呼籲共同努力推動精準醫學創新。 PubMed DOI

基因功能像詞語意義一樣,視語境而異。現有基因註解忽略這複雜性。利用自然語言處理技術,或許能更深入了解基因。現代分佈語義學以向量表示詞語,推動語言模型進步。將基因功能視為細胞語境中的分佈,透過大數據學習,或許能有新突破。 PubMed DOI

GENEVIC是一個由人工智慧驅動的聊天框架,旨在簡化基因數據的分析與知識發現。它能自動檢索、分析和可視化基因資訊,協助生物學家。主要功能包括生成蛋白質互作網絡、豐富基因集,並從PubMed和Google Scholar搜尋文獻。試點階段專注於阿茲海默症、精神分裂症及認知相關基因變異,幫助研究人員優先考慮重要變異。這個平台使用簡單,無需專業訓練,並在安全的HIPAA合規環境中運行,且代碼開源,促進基因研究的合作與發展。 PubMed DOI

OligoM-Cancer平台的開發目的是為了解決寡轉移性癌症(OMC)的理解與治療挑戰。相較於多轉移性癌症,OMC對局部治療的反應較佳,但相關研究仍然不足,因此需要更系統的比較與個性化治療。該平台提供有關OMC的標記、診斷、預後及治療選項的全面資源,並擁有1345篇文獻和393個相關因素的資料庫。OligoM-Cancer利用現代網路技術,旨在提升數據可解釋性,增強臨床實踐,並支持大型語言模型在OMC領域的應用,促進深入分析與提高治療可靠性。 PubMed DOI

這篇論文探討如何利用大型語言模型(LLMs)來簡化生物醫學數據處理,特別是自動化數據發現與整合。我們推廣互操作性標準,透過創建共同數據元素(CDEs)來提升數據整合的效率。經過分析三十一項研究,我們開發了CDEs,並使用API填寫OpenAI GPT模型的元數據。經專家審查,94%的元數據無需手動修訂。我們的方法在阿茲海默症和帕金森基因計畫的數據中測試,顯示出良好的互操作性,旨在提升生物醫學研究的效率與合作性。 PubMed DOI

PRIDE 資料庫是質譜蛋白質組學數據的重要儲存庫,也是 ProteomeXchange 聯盟的成員。這篇手稿回顧了 PRIDE 在過去三年的進展。平均每月接收約 534 個數據集,得益於基礎設施的改善,如新的檔案傳輸協議(Globus)和自動驗證過程。PRIDE 還推出了利用開源大型語言模型的聊天機器人,並加強了與 UniProt、Ensembl 和 Expression Atlas 等資源的合作,以促進高品質蛋白質組學數據的重用與傳播。 PubMed DOI

在科學研究中,隨著出版物數量的增加,管理變得愈加困難。為了解決這個問題,我們開發了一個高通量流程,利用ChatGPT從超過24,000篇秀麗隱杆線蟲和150,000篇果蠅的文獻中提取資訊,成功識別了超過200,000個C. elegans的互動及近120萬個果蠅的互動,建立了全面的生物圖譜。我們還創建了一個可搜尋的線上平台,方便使用者訪問這些知識網絡,並突顯了重要的生物途徑。這些數據庫可在worm.bio-map.com和drosophila.bio-map.com訪問。 PubMed DOI