為蛋白質準確標註功能和催化活性是一項挑戰,尤其是對於缺乏同源蛋白的情況。傳統方法多依賴蛋白質序列,忽略了標籤的語義。為了解決這個問題,我們提出了FAPM模型,結合了蛋白質序列和自然語言,能生成基因本體(GO)功能術語和催化活性預測。研究顯示,FAPM在理解蛋白質特性上表現優於傳統模型,並在噬菌體蛋白的測試中達到最先進的結果。這種方法為蛋白質註釋提供了新的可能性。線上演示可在此網址找到:https://huggingface.co/spaces/wenkai/FAPM_demo。
PubMed
DOI