原始文章

研究蛋白質-蛋白質相互作用(PPIs)對於理解生物過程非常重要,尤其是在抗體與抗原、酶與抑制劑或促進劑的互動上。近期針對PPIs的研究,特別是與SARS-CoV-2的關聯,推動了疫苗的開發。雖然已有數據庫整理PPI網絡,但文本挖掘方法在新研究或少數物種中顯得尤為重要。比較不同的自然語言處理(NLP)工具後發現,傳統方法真陽性率高但網絡過度連接,機器學習方法則網絡結構相似但真陽性率低,而大型語言模型的表現則介於兩者之間。選擇合適的NLP方法需根據研究需求和文本量。 PubMed DOI


站上相關主題文章列表

蛋白質在藥物研發中扮演重要角色,但傳統方法太貴又太慢。研究引入了一個快速又精確的分類器,使用了帶有ESM-2嵌入的蛋白質語言模型(PLM),準確率達95.11%。比較結果顯示,ESM-2嵌入比PSSM特徵更優。同時,開發了基於GPT-2的端對端模型,將大型語言模型成功應用在蛋白質辨識上,並經Pharos數據集驗證表現。 PubMed DOI

了解基因、疾病和藥物對藥物開發很重要。研究指出,基於BERT的模型在識別蛋白質-蛋白質相互作用(PPIs)方面表現最佳,BioBERT召回率和F1分數最高,PubMedBERT精確度最高。即使沒有生物醫學背景,GPT-4也表現優秀。這些結果顯示GPT模型在檢測PPIs上有應用價值,值得進一步研究微調以應用於生物醫學任務。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)預測蛋白質相變(PPTs),對於理解與年齡相關的疾病如阿茲海默症非常重要。研究者微調了一個LLM,評估蛋白質序列變異對PPTs的影響,結果顯示該模型的表現超越傳統方法,並結合隨機森林模型提升可解釋性。此外,研究發現阿茲海默症相關蛋白質的聚集增加與基因表達下降有關,暗示可能存在自然防禦機制來對抗該疾病。 PubMed DOI

檢測蛋白質-蛋白質相互作用(PPIs)對於理解遺傳機制和疾病發展非常重要。隨著生物醫學文獻的增加,自動化提取這些相互作用的需求也愈加迫切。本研究評估了多種基於變壓器的模型在PPIs識別中的效果,發現BioBERT在多個數據集上表現最佳,達到91.95%的召回率。值得注意的是,雖然GPT-4並未專門針對生物醫學文本訓練,但其表現也相當出色,顯示出在生物醫學文獻挖掘上的潛力。相關代碼和數據集可在GitHub上獲得。 PubMed DOI

這項研究評估了21個大型語言模型(LLMs)在檢索生物知識的有效性,特別針對基因調控和KEGG途徑。隨著生物文獻的快速增長,傳統手動整理已不再足夠,LLMs成為一個有前景的替代方案。 結果顯示,模型性能差異明顯,GPT-4和Claude-Pro在基因調控關係的F1分數分別為0.4448和0.4386,KEGG途徑的Jaccard指數也表現強勁。相比之下,開源模型表現較差。研究強調選擇合適模型的重要性,並提供了LLMs在生物研究中的應用見解,相關代碼已在GitHub上公開。 PubMed DOI

預測蛋白質-蛋白質相互作用位點對於理解生化過程非常重要,尤其是在病毒與受體蛋白質的互動中,有助於疾病機制和藥物開發。傳統方法面臨處理時間長、成本高和準確性低的挑戰。為了解決這些問題,我們提出了一種新穎的網絡,利用多重信息融合來預測相互作用位點。透過圖卷積網絡、雙向長短期記憶(BiLSTM)和ProtT5模型,我們的模型在多項評估指標上超越現有方法,顯示出其有效性和優越性。 PubMed DOI

這項研究探討了研究人員在處理大量生物醫學文獻時的挑戰,並提出了一種混合方法,結合文本挖掘、圖神經網絡(GNNs)和微調的大型語言模型(LLMs)。這種方法旨在增強生物醫學知識圖譜,並解釋預測的關係。研究顯示,該方法在蛋白質相互作用數據集上達到0.772的馬修斯相關係數,並在失眠研究中識別出25個新的人類蛋白質相互作用。這種方法有助於加速治療靶點的發現,並提高文獻分析的效率。 PubMed DOI

ProtChat是一個創新的AI多代理系統,專門用於蛋白質分析,結合了蛋白質大型語言模型和像GPT-4這樣的技術。它能自動化複雜任務,如預測蛋白質特性和分析蛋白質-藥物相互作用,大幅減少人力需求。即使沒有計算背景的研究人員也能輕鬆使用,提升分析效率。實驗結果顯示,ProtChat能快速且準確地處理蛋白質相關任務,為計算生物學和藥物發現開創新機會。其程式碼和數據已在GitHub上公開,鼓勵更多人探索應用。 PubMed DOI

我們開發了一個自動化工具,利用大型語言模型(LLM)來簡化從超過81,000篇與蛋白質資料庫(PDB)相關的文章中提取和分類蛋白質的表達及純化方法。這個工具能有效解決優化蛋白質樣本的挑戰,因為表達條件和純化策略的變化常常耗時。主要發現包括:Tris緩衝液最常用,聚組氨酸標籤佔主導,最佳表達溫度為16-20 °C,誘導時間偏好12-16小時。這個資源對研究人員設計蛋白質實驗非常有幫助。 PubMed DOI

蛋白質語言模型(pLMs)正逐漸成為理解蛋白質序列及其功能的重要工具,特別是在預測分子功能方面,如識別結合位點和評估基因變異影響。不過,單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM,可以提升其效率和準確性,尤其在實驗數據不足的情況下。總的來說,pLM為計算生物學與實驗生物學的整合鋪路,預示著蛋白質設計的新時代。 PubMed DOI