原始文章

PRIDE 資料庫是質譜蛋白質組學數據的重要儲存庫,也是 ProteomeXchange 聯盟的成員。這篇手稿回顧了 PRIDE 在過去三年的進展。平均每月接收約 534 個數據集,得益於基礎設施的改善,如新的檔案傳輸協議(Globus)和自動驗證過程。PRIDE 還推出了利用開源大型語言模型的聊天機器人,並加強了與 UniProt、Ensembl 和 Expression Atlas 等資源的合作,以促進高品質蛋白質組學數據的重用與傳播。 PubMed DOI


站上相關主題文章列表

聊天機器人助理基礎架構簡化了使用多個大型語言模型和Elo排名系統,與PRIDE數據庫互動。包括API、Web界面和管理向量數據庫的組件,提升數據集可發現性。適用於生物信息學和蛋白質組學工具,並開源在GitHub。 PubMed DOI

分享微生物群組數據給研究人員有助於發現新知,也能省下研究成本。為了達成這目標,數據需標準化、透明化,且易取得。建議建立一個符合FAIR原則的人體微生物群組和宿主相關數據的實時數據庫,並討論了隱私法律、人類基因組序列和FAIR合規性的挑戰及解決方案。使用Supabase開源平台實施數據庫,確保數據符合FAIR原則並保護參與者隱私。同時開發ChatGPT驅動的大型語言模型(LLM),促進知識共享和用戶友好地訪問數據庫。 PubMed DOI

Harmonizome 3.0 是 Harmonizome 資料庫的升級版,整理了各種 omics 數據,突顯基因與其屬性之間的關聯。新版本新增 26 個數據集,總共近 1200 萬個基因-屬性關聯,並具備數據集交叉能力,能識別共享的基因模組。大型語言模型提供推測性見解,並改善了數據格式與可視化選項,使用者可下載知識圖譜並使用 UMAP 圖進行視覺化。透過互動介面,使用者能探索基因-屬性關聯,網址為 https://maayanlab.cloud/Harmonizome/。 PubMed DOI