Large language models reshaping molecular biology and drug development.
大型語言模型重塑分子生物學和藥物開發。 Chem Biol Drug Des 2024-06-19

大型語言模型（LLMs）在醫學和臨床資訊學中扮演重要角色，能幫助突破和個人化治療。透過分析複雜的生物數據，揭示基因組學、蛋白質結構和健康記錄中的隱藏模式，對基因組分析、藥物開發和精準醫學有所助益。然而，必須面對數據偏見、隱私和道德等挑戰，才能負責任地應用。克服這些障礙將帶來分子生物學和製藥研究的重大進展，造福個人和社區。 PubMed DOI

Large language models facilitating modern molecular biology and novel drug development.
大型語言模型促進現代分子生物學與新藥開發。 Front Pharmacol 2025-01-08

最近，人工智慧（AI）和深度學習（DL）在醫療保健領域的進展非常顯著，尤其是大型語言模型（LLMs）的應用。這些模型改善了研究人員與AI系統的溝通，特別是在藥物開發上。回顧中強調了LLM在製藥領域的創新，並探討了其技術和倫理挑戰。預期未來LLM將在創新藥物的開發中扮演更重要的角色，助力突破性製藥的進展。 PubMed DOI

Leveraging large language models for peptide antibiotic design.
利用大型語言模型進行肽類抗生素設計。 Cell Rep Phys Sci 2025-02-14

大型語言模型（LLMs）在生物學和化學等複雜領域中影響深遠，特別是在分子設計和優化方面。本篇綜述專注於LLMs在抗生素發現與設計中的應用，特別是肽類分子。我們將探討LLMs在藥物設計的最新進展，以及在抗生素開發中應用這些模型所面臨的挑戰。 PubMed DOI

RNA-protein interaction prediction using network-guided deep learning.
基於網絡引導的深度學習進行 RNA-蛋白質相互作用預測。 Commun Biol 2025-02-16

ZHMolGraph是一種創新的方法，專門用來預測RNA與蛋白質之間的相互作用，成功解決了未知RNA和蛋白質的挑戰。它結合了圖神經網絡和無監督的大型語言模型，在基準數據集上表現優異，對完全未知的RNA-蛋白質對，AUROC達到79.8%，AUPRC為82.0%。這顯示出相較於現有方法的顯著進步，AUROC提升了7.1%-28.7%，AUPRC增加了4.6%-30.0%。此外，ZHMolGraph也能增強對SARS-CoV-2 RNA-蛋白質相互作用的預測，展現其在全基因組預測及複合體建模的潛力。 PubMed DOI

Comprehensive benchmarking of large language models for RNA secondary structure prediction.
大型語言模型在RNA二級結構預測中的綜合基準評估。 Brief Bioinform 2025-04-10

近年來，受到DNA和蛋白質大型語言模型的啟發，幾個針對RNA的大型語言模型相繼問世。這些RNA-LLMs透過大量RNA數據集自我學習，旨在提升RNA二級結構預測的準確性。然而，針對這項任務的統一評估仍然不足。本研究對多種預訓練RNA-LLMs進行深入比較，評估它們在二級結構預測中的表現。結果顯示，有兩個模型表現優異，並揭示了低同源性情境下的挑戰。此外，研究提供了不同難度的基準數據集和標準化實驗設置，相關代碼和數據可在GitHub上獲得。 PubMed DOI

A Comprehensive Review of Computational Methods for Protein-DNA Binding Site Prediction.
蛋白質-DNA 結合位點預測的計算方法綜述。 Anal Biochem 2025-04-10

這項研究強調準確識別蛋白質-DNA結合位點的重要性，對理解生物過程和推進藥物發現至關重要。傳統生化方法雖然是金標準，但因耗時耗資而不實用，因此需要高效的計算方法來預測這些位點。文章將計算方法分為三類：模板檢測、統計機器學習和深度學習，並用136個非冗餘蛋白質的基準評估14個預測模型。結果顯示，深度學習方法，特別是利用預訓練大型語言模型的，準確性最佳。此外，研究還探討了這些預測方法在生物研究和藥物設計中的應用潛力。 PubMed DOI

DrugGen enhances drug discovery with large language models and reinforcement learning.
DrugGen 結合大型語言模型與強化學習以促進新藥發現 Sci Rep 2025-04-18

傳統藥物設計又慢又容易失敗，深度學習模型像DrugGPT雖然能產生新分子，但常常沒用。DrugGen是改良版，結合真實資料和優化技術，能產生100%有效分子，預測和多樣性都更好。測試證明它有效，還能幫助藥物再利用和新藥設計，大大提升藥物開發效率。 PubMed DOI

Ranking Protein-Protein Models with Large Language Models and Graph Neural Networks.
結合大型語言模型與圖神經網路對蛋白質-蛋白質模型進行排序 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對疾病研究和藥物開發很重要，但從眾多模擬結構中挑出最準確的很困難。DeepRank-GNN-esm 是一款深度學習工具，結合圖形化方法和蛋白質語言模型，能有效排序並選出最佳PPI模型。詳細教學和工具下載可參考 https://github.com/haddocking/DeepRank-GNN-esm。 PubMed DOI

Large Context, Deeper Insights: Harnessing Large Language Models for Advancing Protein-Protein Interaction Analysis.
大語言模型於促進蛋白質-蛋白質交互作用分析之應用：大範疇背景，深入洞見 Methods Mol Biol 2025-07-02

蛋白質-蛋白質交互作用（PPIs）對生物研究和新藥開發很關鍵。現在大型語言模型（LLMs）已能從蛋白質序列分析PPIs，處理大規模資料也沒問題。不過，還有像運算量大、資料不平衡和多種資料整合等挑戰。未來會持續優化，讓LLMs在生物領域發揮更大作用。 PubMed DOI

Predicting RNA Structure Utilizing Attention from Pretrained Language Models.
利用預訓練語言模型的注意力機制預測RNA結構 J Chem Inf Model 2025-07-02

RNA除了攜帶遺傳資訊，還有許多結構相關的功能。雖然AI和大型語言模型（LLMs）在蛋白質結構預測上很有成效，但目前幾個主流的核酸語言模型（如RNABERT、ERNIE-RNA等）在RNA三維結構預測上表現有限，主要是因為模型設計上還有不少瓶頸。 PubMed DOI

原始文章

站上相關主題文章列表