Harnessing Large Language Models to Collect and Analyze Metal-Organic Framework Property Data Set.
利用大型語言模型收集和分析金屬有機框架性質數據集。 J Am Chem Soc 2025-01-21

這項研究旨在從科學文獻中有效收集金屬有機框架（MOFs）的實驗數據，以解決稀缺數據的問題，並提升材料科學中機器學習的應用質量。研究團隊利用先進的大型語言模型，系統化提取並整理MOF數據，成功從超過40,000篇文章中彙編出詳細的合成條件和性質數據。整理後的數據庫用於分析合成條件、性質和結構之間的關係，並創建合成條件推薦系統，為優化合成策略提供實用工具，顯示實驗數據集在推進MOFs研究中的重要性。 PubMed DOI

AI-enabled alkaline-resistant evolution of protein to apply in mass production.
AI 驅動的耐鹼蛋白進化以應用於大規模生產。 Elife 2025-02-19

這項研究強調了先進的大型語言模型（LLM），特別是Pro-PRIME模型，在增強結合生長激素的VHH抗體的穩定性方面的成效。考慮到蛋白質常需在極端環境中運作，研究探討了設計更高穩定性和功能性蛋白質的挑戰。經過兩輪設計，成功產生了一種突變抗體，具備更好的熱穩定性、極端pH抵抗力及更強的結合親和力。這是LLM設計的蛋白質產品首次成功應用於大規模生產，顯示其在蛋白質工程上的潛力。 PubMed DOI

Teaching AI to speak protein.
教導人工智慧理解蛋白質語言。 Curr Opin Struct Biol 2025-02-22

蛋白質語言模型（pLMs）正逐漸成為理解蛋白質序列及其功能的重要工具，特別是在預測分子功能方面，如識別結合位點和評估基因變異影響。不過，單靠pLM嵌入在蛋白質結構預測上仍無法與最佳方法相提並論。透過微調這些pLM，可以提升其效率和準確性，尤其在實驗數據不足的情況下。總的來說，pLM為計算生物學與實驗生物學的整合鋪路，預示著蛋白質設計的新時代。 PubMed DOI

Comparative Assessment of Protein Large Language Models for Enzyme Commission Number Prediction.
酶委員會編號預測的蛋白質大型語言模型比較評估。 BMC Bioinformatics 2025-02-27

這項研究評估了幾種蛋白質大型語言模型（LLMs），如ESM2、ESM1b和ProtBERT，在預測酶功能方面的表現，並與傳統的序列比對方法BLASTp進行比較。雖然BLASTp通常表現較佳，但LLMs，特別是結合全連接神經網絡時，超越了傳統的一熱編碼模型。ESM2被認為是最有效的LLM，尤其在挑戰性註釋任務中表現突出。研究顯示，LLMs雖未達到BLASTp的黃金標準，但在序列同一性低的情況下，能有效預測難以註釋的酶的EC編號，並強調兩者可互補，提升酶的註釋效果。 PubMed DOI

The influence of prompt engineering on large language models for protein-protein interaction identification in biomedical literature.
即時提示工程對大型語言模型於生物醫學文獻中辨識蛋白質-蛋白質交互作用的影響 Sci Rep 2025-05-03

這篇研究比較了 GPT-3.5、GPT-4 和 Google Gemini 等大型語言模型在生物醫學文本中擷取蛋白質-蛋白質交互作用的能力。結果顯示，Gemini 1.5 Pro 表現最好，F1 分數最高達 90.3%。雖然還不如專業模型，但只要設計好提示詞，這些工具對生物醫學研究人員來說就很容易上手。 PubMed DOI

Comparative Performance Evaluation of Large Language Models for Extracting Molecular Interactions and Pathway Knowledge.
大型語言模型於分子交互作用與途徑知識擷取之比較性效能評估 J Comput Biol 2025-05-19

這項研究發現，大型語言模型（LLMs）能自動從文本中擷取蛋白質交互等分子資料，表現比人工處理更有效率。雖然在部分基因細節上還有困難，但整體來說，LLMs有助於加速生物知識的發現與應用。 PubMed DOI

A Survey of Pretrained Protein Language Models.
預訓練蛋白質語言模型之調查 Methods Mol Biol 2025-07-02

蛋白質語言模型（PLMs）受大型語言模型啟發，已大幅推動蛋白質生物資訊學發展，特別在分類、功能預測和新蛋白質設計上表現亮眼。本章介紹PLMs的發展、主要架構及新趨勢，強調這些技術對解決生物學難題越來越重要。 PubMed DOI

A Survey of Biological Function Prediction Methods with Focus on Natural Language Processing (NLP) and Large Language Models (LLM).
聚焦於自然語言處理（NLP）與大型語言模型（LLM）的生物功能預測方法綜述 Methods Mol Biol 2025-07-02

**重點摘要：** 這份調查回顧了目前用來預測蛋白質功能的模型，特別著重於運用自然語言處理（NLP）和大型語言模型（LLMs）來分析蛋白質序列和科學文獻的相關方法。內容強調了近期在自動化蛋白質功能註解（從序列資料和已發表研究中）方面的進展，以及目前仍面臨的挑戰。 PubMed DOI

Large Context, Deeper Insights: Harnessing Large Language Models for Advancing Protein-Protein Interaction Analysis.
大語言模型於促進蛋白質-蛋白質交互作用分析之應用：大範疇背景，深入洞見 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對生物研究和新藥開發很關鍵。現在大型語言模型（LLMs）已能從蛋白質序列分析PPIs，處理大規模資料也沒問題。不過，還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化，讓LLMs在生物領域發揮更大作用。 PubMed DOI

Large Language Model (LLM)-Based Advances in Prediction of Post-translational Modification Sites in Proteins.
基於大型語言模型（LLM）在蛋白質翻譯後修飾位點預測上的新進展 Methods Mol Biol 2025-07-02

本章介紹用蛋白質語言模型（pLMs）預測蛋白質翻譯後修飾（PTM）位點的最新進展，強調pLMs能提升預測準確度。內容也提到微調、多模態整合、新型架構等趨勢，並討論模型可解釋性、現有限制及未來發展方向。 PubMed DOI

原始文章

站上相關主題文章列表