原始文章

這項研究提出了一種新方法來理解澀味,這種感官體驗會讓口腔感到乾燥,影響葡萄酒和茶等食物的味道。研究建立了包含238種澀味分子的數據庫,並開發了結合大型語言模型和機器學習的預測框架,能準確預測分子和肽的特性。研究還建立了一個高準確度的澀味預測器,並驗證其結果。此外,發現51%的澀味分子具抗菌特性。這些成果可透過AstringentPD和ABPD網站獲得,為食品科學和醫藥研究提供新方向。 PubMed DOI


站上相關主題文章列表

研究發現第二類微囊素具抗生素潛力,但因為短小且多樣,發現受限。利用蛋白語言模型探測微囊素於細菌基因組,比傳統BLAST更有效。可準確辨識微囊素,並發現被忽略的新微囊素。 PubMed DOI

蛋白質在藥物研發中扮演重要角色,但傳統方法太貴又太慢。研究引入了一個快速又精確的分類器,使用了帶有ESM-2嵌入的蛋白質語言模型(PLM),準確率達95.11%。比較結果顯示,ESM-2嵌入比PSSM特徵更優。同時,開發了基於GPT-2的端對端模型,將大型語言模型成功應用在蛋白質辨識上,並經Pharos數據集驗證表現。 PubMed DOI

研究利用新科技預測分子的苦甜味,GPT-4表現準確。透過ChatGPT提取特徵,創造新化合物味道。經過多項測試證實,顯示語言模型在健康和化學領域有應用價值。 PubMed DOI

大型語言模型(LLMs)在醫學和臨床資訊學中扮演重要角色,能幫助突破和個人化治療。透過分析複雜的生物數據,揭示基因組學、蛋白質結構和健康記錄中的隱藏模式,對基因組分析、藥物開發和精準醫學有所助益。然而,必須面對數據偏見、隱私和道德等挑戰,才能負責任地應用。克服這些障礙將帶來分子生物學和製藥研究的重大進展,造福個人和社區。 PubMed DOI

AMPs是短肽,可對抗微生物藥物的抗藥性。開發受到對人體細胞的毒性影響,難以控制。GPT-3已用於預測AMP活性和毒性,但簡單模型如RNN和SVM表現更佳。建議目前使用簡單模型,但需重新評估大型語言模型的潛力。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)預測蛋白質相變(PPTs),對於理解與年齡相關的疾病如阿茲海默症非常重要。研究者微調了一個LLM,評估蛋白質序列變異對PPTs的影響,結果顯示該模型的表現超越傳統方法,並結合隨機森林模型提升可解釋性。此外,研究發現阿茲海默症相關蛋白質的聚集增加與基因表達下降有關,暗示可能存在自然防禦機制來對抗該疾病。 PubMed DOI

酵素在生物技術中非常重要,應用於食品、洗衣、製藥等領域,因為它們能催化化學反應。酵素的活性受pH值影響,每種酵素在特定pH範圍內表現最佳。為了解決這個挑戰,我們開發了一種基於語言模型的方法,預測酵素序列的最佳pH範圍。透過多種切分策略,我們的機器學習模型在不同蛋白質家族中展現高準確性,能快速識別具有理想pH的酵素,促進高通量探索。 PubMed DOI

II類微菌素是一種有潛力的新型抗生素,但目前識別的數量有限。本研究探討利用蛋白質大型語言模型的數值嵌入來檢測細菌基因組中的微菌素,並與傳統的序列比對方法(如BLAST)進行比較。結果顯示,嵌入法在識別已知II類微菌素上更有效,還能發現一些傳統方法忽略的新型微菌素。隨著抗生素抗藥性問題日益嚴重,發現新的抗菌肽至關重要,這項研究為對抗細菌感染提供了新策略。 PubMed DOI

這項研究開發了一種名為DeepAIP的深度學習模型,專門用來預測抗炎肽(AIPs)。由於傳統的抗炎治療方法如NSAIDs和糖皮質激素常有副作用,尋找替代療法變得相當重要。DeepAIP結合了上下文自注意力機制和預訓練的蛋白質語言模型,顯著提高了預測準確性。測試中,Prot-T5表現最佳,DeepAIP的表現超越現有方法,成功識別17個新型抗炎肽序列。研究數據和代碼已在GitHub上公開。 PubMed DOI

高血壓是一種常見的慢性病,會增加心血管疾病的風險。血管緊張素轉換酶(ACE)在血壓調控中扮演重要角色,傳統藥物常有副作用,因此對能抑制 ACE 的食物來源肽(ACEIP)產生興趣。文章介紹了一個新模型 AI4ACEIP,利用兩層堆疊集成架構來識別 ACEIP,並透過 PowerShap 方法優化特徵選擇。研究顯示,AI4ACEIP 的預測表現優於七種現有方法,並可在 GitHub 上公開使用。 PubMed DOI