PRIDE 資料庫是質譜蛋白質組學數據的重要儲存庫,也是 ProteomeXchange 聯盟的成員。這篇手稿回顧了 PRIDE 在過去三年的進展。平均每月接收約 534 個數據集,得益於基礎設施的改善,如新的檔案傳輸協議(Globus)和自動驗證過程。PRIDE 還推出了利用開源大型語言模型的聊天機器人,並加強了與 UniProt、Ensembl 和 Expression Atlas 等資源的合作,以促進高品質蛋白質組學數據的重用與傳播。 PubMed DOI ♡
聊天機器人助理基礎架構簡化了使用多個大型語言模型和Elo排名系統,與PRIDE數據庫互動。包括API、Web界面和管理向量數據庫的組件,提升數據集可發現性。適用於生物信息學和蛋白質組學工具,並開源在GitHub。 PubMed DOI
分享微生物群組數據給研究人員有助於發現新知,也能省下研究成本。為了達成這目標,數據需標準化、透明化,且易取得。建議建立一個符合FAIR原則的人體微生物群組和宿主相關數據的實時數據庫,並討論了隱私法律、人類基因組序列和FAIR合規性的挑戰及解決方案。使用Supabase開源平台實施數據庫,確保數據符合FAIR原則並保護參與者隱私。同時開發ChatGPT驅動的大型語言模型(LLM),促進知識共享和用戶友好地訪問數據庫。 PubMed DOI