Integrating genetic algorithms and language models for enhanced enzyme design.
整合遺傳算法與語言模型以增強酶的設計。 Brief Bioinform 2025-01-09

這項研究提出了一個新框架，結合大型語言模型（LLMs）和遺傳演算法（GAs），用來優化酶的設計，解決蛋白質序列及功能的複雜挑戰。研究人員透過大量蛋白質序列數據，找出影響酶結構和功能的氨基酸關係，並利用遺傳演算法有效搜尋能提升催化性能的酶序列。測試結果顯示，生成的酶突變體在90%的案例中超越野生型酶，並維持相似的結構特徵，顯示這種方法的有效性，推進了生物催化劑設計的計算方法。 PubMed DOI

Using Large Language Model to Optimize Protein Purification: Insights from Protein Structure Literature Associated with Protein Data Bank.
利用大型語言模型優化蛋白質純化：來自與蛋白質數據庫相關的蛋白質結構文獻的見解。 Adv Sci (Weinh) 2025-02-20

我們開發了一個自動化工具，利用大型語言模型（LLM）來簡化從超過81,000篇與蛋白質資料庫（PDB）相關的文章中提取和分類蛋白質的表達及純化方法。這個工具能有效解決優化蛋白質樣本的挑戰，因為表達條件和純化策略的變化常常耗時。主要發現包括：Tris緩衝液最常用，聚組氨酸標籤佔主導，最佳表達溫度為16-20 °C，誘導時間偏好12-16小時。這個資源對研究人員設計蛋白質實驗非常有幫助。 PubMed DOI

Teaching AI to speak protein.
教導人工智慧理解蛋白質語言。 Curr Opin Struct Biol 2025-02-22

蛋白質語言模型（pLMs）正逐漸成為理解蛋白質序列及其功能的重要工具，特別是在預測分子功能方面，如識別結合位點和評估基因變異影響。不過，單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM，可以提升其效率和準確性，尤其在實驗數據不足的情況下。總的來說，pLM為計算生物學與實驗生物學的整合鋪路，預示著蛋白質設計的新時代。 PubMed DOI

Comprehensive benchmarking of large language models for RNA secondary structure prediction.
大型語言模型在RNA二級結構預測中的綜合基準評估。 Brief Bioinform 2025-04-10

近年來，受到DNA和蛋白質大型語言模型的啟發，幾個針對RNA的大型語言模型相繼問世。這些RNA-LLMs透過大量RNA數據集自我學習，旨在提升RNA二級結構預測的準確性。然而，針對這項任務的統一評估仍然不足。本研究對多種預訓練RNA-LLMs進行深入比較，評估它們在二級結構預測中的表現。結果顯示，有兩個模型表現優異，並揭示了低同源性情境下的挑戰。此外，研究提供了不同難度的基準數據集和標準化實驗設置，相關代碼和數據可在GitHub上獲得。 PubMed DOI

Fine-tuning of conditional Transformers improves <i>in silico</i> enzyme prediction and generation.
微調條件式 Transformers 改善了<i>in silico</i>酵素預測與生成。 Comput Struct Biotechnol J 2025-04-16

Finenzyme 是一款新型蛋白質語言模型，能針對特定功能產生並預測酵素序列，表現比 ProGen 這類通用模型更好。雖然產生的序列和天然酵素不同，但結構和功能都很接近，讓它在酵素工程等應用上很有潛力。 PubMed DOI

Comparative Performance Evaluation of Large Language Models for Extracting Molecular Interactions and Pathway Knowledge.
大型語言模型於分子交互作用與途徑知識擷取之比較性效能評估 J Comput Biol 2025-05-19

這項研究發現，大型語言模型（LLMs）能自動從文本中擷取蛋白質交互等分子資料，表現比人工處理更有效率。雖然在部分基因細節上還有困難，但整體來說，LLMs有助於加速生物知識的發現與應用。 PubMed DOI

A Survey of Pretrained Protein Language Models.
預訓練蛋白質語言模型之調查 Methods Mol Biol 2025-07-02

蛋白質語言模型（PLMs）受大型語言模型啟發，已大幅推動蛋白質生物資訊學發展，特別在分類、功能預測和新蛋白質設計上表現亮眼。本章介紹PLMs的發展、主要架構及新趨勢，強調這些技術對解決生物學難題越來越重要。 PubMed DOI

A Survey of Biological Function Prediction Methods with Focus on Natural Language Processing (NLP) and Large Language Models (LLM).
聚焦於自然語言處理（NLP）與大型語言模型（LLM）的生物功能預測方法綜述 Methods Mol Biol 2025-07-02

**重點摘要：** 這份調查回顧了目前用來預測蛋白質功能的模型，特別著重於運用自然語言處理（NLP）和大型語言模型（LLMs）來分析蛋白質序列和科學文獻的相關方法。內容強調了近期在自動化蛋白質功能註解（從序列資料和已發表研究中）方面的進展，以及目前仍面臨的挑戰。 PubMed DOI

Large Context, Deeper Insights: Harnessing Large Language Models for Advancing Protein-Protein Interaction Analysis.
大語言模型於促進蛋白質-蛋白質交互作用分析之應用：大範疇背景，深入洞見 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對生物研究和新藥開發很關鍵。現在大型語言模型（LLMs）已能從蛋白質序列分析PPIs，處理大規模資料也沒問題。不過，還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化，讓LLMs在生物領域發揮更大作用。 PubMed DOI

Large Language Model (LLM)-Based Advances in Prediction of Post-translational Modification Sites in Proteins.
基於大型語言模型（LLM）在蛋白質翻譯後修飾位點預測上的新進展 Methods Mol Biol 2025-07-02

本章介紹用蛋白質語言模型（pLMs）預測蛋白質翻譯後修飾（PTM）位點的最新進展，強調pLMs能提升預測準確度。內容也提到微調、多模態整合、新型架構等趨勢，並討論模型可解釋性、現有限制及未來發展方向。 PubMed DOI

原始文章

站上相關主題文章列表