原始文章

這項研究開發了 EDS-Kcr 工具,結合蛋白質語言模型和深度學習,能更準確預測蛋白質的 lysine crotonylation(Kcr)位點,表現優於現有方法。EDS-Kcr 支援多種物種,解釋性佳,並提供免費網頁伺服器,方便應用於疾病診斷和藥物開發。 PubMed DOI


站上相關主題文章列表

酶功能對醫學和生物技術至關重要,但現有方法速度慢且解釋不清。ifDEEPre是DEEPre的新版本,利用自導注意力和生物知識快速預測酶功能。ifDEEPre比DEEPre快50倍,且儲存空間需求較少,在酶數據集上表現更好。這個模型準確捕捉複雜蛋白質模式和演化趨勢,可幫助設計新酶。ifDEEPre的網頁伺服器和程式碼對大眾開放使用。 PubMed DOI

這項研究探討DNA胞嘧啶甲基化在細胞調控中的角色,特別是小鼠和人類胚胎幹細胞中TET和DNMT3基因的敲除突變體。研究有三個主要目標:訓練大型語言模型識別差異甲基化胞嘧啶、檢驗人類和小鼠基因組中DMCs的預測能力,以及評估DNMT3和TET敲除數據的預測效果。研究成功識別出與突變體DMC預測相關的重要基序,增進了對幹細胞DNA甲基化的理解。相關軟體已在GitHub上公開。 PubMed DOI

這項研究推出了一個名為蛋白質重要性計算器(PIC)的深度學習模型,旨在提升人類必需蛋白質(HEPs)的識別。傳統方法成本高且勞動密集,且多數僅能在細胞系層面預測HEPs,無法適應不同生物背景。PIC透過微調的蛋白質語言模型,能在三個層面(人類、細胞系、小鼠)更準確地預測HEPs,並引入蛋白質重要性分數來量化其必需性。這個分數經過生物分析驗證,顯示在乳腺癌預後生物標記識別上有潛力,並可評估大量人類微蛋白質的必需性,展現其在生物醫學研究中的廣泛應用。 PubMed DOI

蛋白質對生物功能至關重要,而可控的蛋白質編輯技術進步讓我們能更深入探索自然系統及開發新藥物。機器學習輔助的蛋白質編輯(MLPE)雖然有潛力,但面臨組合可能性廣泛的挑戰。為此,我們提出了ProtET,透過多模態學習進行高效蛋白質編輯,並在實驗中顯示其在滿足人類期望的屬性上表現優於現有方法,特別是在穩定性方面有顯著改善。ProtET將成為推進人工蛋白質編輯的重要工具,滿足學術及產業需求。 PubMed DOI

我們開發了一個自動化工具,利用大型語言模型(LLM)來簡化從超過81,000篇與蛋白質資料庫(PDB)相關的文章中提取和分類蛋白質的表達及純化方法。這個工具能有效解決優化蛋白質樣本的挑戰,因為表達條件和純化策略的變化常常耗時。主要發現包括:Tris緩衝液最常用,聚組氨酸標籤佔主導,最佳表達溫度為16-20 °C,誘導時間偏好12-16小時。這個資源對研究人員設計蛋白質實驗非常有幫助。 PubMed DOI

這項研究聚焦於DNA甲基化,這是影響細胞過程的重要表觀遺傳標記。雖然大多數哺乳動物的基因組中,胞嘧啶的甲基化模式相對穩定,但某些調控區域如啟動子和增強子則可能有變化,這些變化由酶DNMT3和TET調控。研究團隊開發了L-MAP,一個基於變壓器的機器學習模型,能根據周圍DNA序列預測差異甲基化的胞嘧啶。經過人類和小鼠胚胎幹細胞的實驗訓練後,L-MAP在預測上表現出高準確性,並揭示了與DNMT3和TET活性相關的序列基序,幫助我們更深入了解幹細胞中的DNA甲基化。該模型已公開供進一步研究使用。 PubMed DOI

乳酸化是一種新發現的翻譯後修飾,主要影響賴氨酸殘基,對細胞功能和疾病有重要影響。為了更好地理解乳酸化的生物學角色,我們開發了PBertKla這個預測工具,利用優化的蛋白質語言模型來預測賴氨酸乳酸化位點。實驗結果顯示,PBertKla在獨立驗證數據上達到超過0.880的AUC值,並且在特徵可視化上表現出色,超越其他模型,顯示其有效性和適應性。這項工具對於進一步研究乳酸化及其對健康的影響具有重要意義。 PubMed DOI

這項研究用大型語言模型把蛋白質序列轉成SMILES格式,再結合圖神經網路,準確辨識CRISPR-Cas系統裡的Cas1蛋白。新方法比現有工具更準確,還能在大數據中找到新Cas1候選蛋白,展現高穩定性。未來也有機會應用在其他Cas蛋白辨識,證明SMILES編碼在蛋白質分析上很有潛力。 PubMed DOI

這篇研究用先進的蛋白質語言模型ESM2,搭配LoRA微調,準確預測蛋白質磷酸化位點。結合conformer架構和特徵耦合技術,AUC分數創新高(S位點79.5%、T位點76.3%、Y位點71.4%)。作者也提出新的評估方法「線性回歸斷層掃描」,並公開所有資料和程式碼。 PubMed DOI

這項研究開發了新型機器學習和深度學習模型,能預測15種人類細胞株中,哪些長鏈非編碼RNA在細胞質比細胞核更豐富。傳統機器學習模型表現比大型語言模型更好,AUC分數約0.71。研究團隊也提供了細胞株專屬的預測工具和網頁伺服器,方便研究人員使用。 PubMed DOI