Genomic language models: opportunities and challenges.
基因組語言模型：機會與挑戰。 Trends Genet 2025-01-03

大型語言模型（LLMs）正在改變生物醫學科學，特別是在理解生物序列方面。基因組語言模型（gLMs）專注於DNA序列，能幫助預測基因組中重要的功能區域、設計新DNA序列，並促進轉移學習。儘管如此，開發有效的gLMs仍面臨挑戰，如數據質量、模型架構及評估指標等。解決這些問題對於gLMs在複雜生物系統中的應用至關重要。 PubMed DOI

Steering veridical large language model analyses by correcting and enriching generated database queries: first steps toward ChatGPT bioinformatics.
透過修正和豐富生成的資料庫查詢來引導真實的大型語言模型分析：邁向 ChatGPT 生物資訊學的第一步。 Brief Bioinform 2025-02-06

這段文字探討大型語言模型（LLMs）如ChatGPT在生物資訊學，特別是基因組學中的限制，提到資料檢索不佳、幻覺及序列操作錯誤等問題。為了解決這些挑戰，作者提出NagGPT作為LLMs與資料庫的橋樑，幫助精煉查詢並提高資訊準確性。此外，還介紹了Genomics Fetcher-Analyzer，這個自訂GPT能讓ChatGPT生成並執行Python程式碼，進行生物資訊學任務，並使用各種基因組資料庫的資料。整體目的是增強ChatGPT在生物資訊學的功能，提升事實準確性和遵循指示的能力。 PubMed DOI

Assessing the performance of generative artificial intelligence in retrieving information against manually curated genetic and genomic data.
評估生成式人工智慧在檢索手動策劃的遺傳和基因組數據方面的表現。 Database (Oxford) 2025-02-18

這篇論文探討大型語言模型（LLMs），特別是GPT-3.5和GPT-4，在數據提取和呈現的有效性，並與人類策展人比較。研究聚焦於小麥和大麥的遺傳特徵，使用36篇期刊文章的資料供GrainGenes數據庫使用。主要發現包括：GPT-4在分類手稿準確率達97%，有效提取80%特徵，並顯示人類與AI合作的潛力。儘管LLMs有其限制，但在生物數據提取上仍能提供顯著幫助，使用者需謹慎對待不準確性。 PubMed DOI

Assessing the performance of generative artificial intelligence in retrieving information against manually curated genetic and genomic data.
生成式人工智慧在檢索手動整理的遺傳與基因體資料時的表現評估 Database (Oxford) 2025-04-22

這項研究發現，GPT-4在整理小麥和大麥相關科學論文的遺傳資料時，準確率高達97%，擷取性狀和標記-性狀關聯的表現也比GPT-3.5好，錯誤率更低。GPT-4有時甚至能達到人類專家的96%水準。雖然還有改進空間，但未來在協助整理科學資料上很有潛力。 PubMed DOI

Pipeline to explore information on genome editing using large language models and genome editing meta-database.
利用大型語言模型與基因編輯元資料庫探索基因編輯資訊的流程 Database (Oxford) 2025-04-22

這項研究用大型語言模型，從GEM資料庫和文獻中自動萃取基因編輯細節，突破了原本資料庫的限制。這讓研究人員能更快找到重要基因、規劃實驗，提升基因編輯研究效率。相關工具和資料已在GitHub公開，方便大家使用。 PubMed DOI

Inferring Drug-Gene Relationships in Cancer Using Literature-Augmented Large Language Models.
利用文獻增強大型語言模型推論癌症中的藥物-基因關係 Cancer Res Commun 2025-04-28

**重點摘要：** 這項研究介紹了一個名為 GeneRxGPT 的工具，它結合了大型語言模型（LLMs）和最新的生醫文獻，讓癌症研究人員可以更輕鬆地發現藥物與基因之間的關係、找出新的治療標的、藥物再利用，以及更深入了解複雜的分子交互作用——而且不需要具備進階的電腦運算技能。 PubMed DOI

Pipeline to explore information on genome editing using large language models and genome editing meta-database.
利用大型語言模型與基因編輯元資料庫探索基因編輯資訊之流程 Database (Oxford) 2025-05-22

這項研究用大型語言模型，從GEM資料庫和文獻中自動萃取、量化基因編輯資訊，突破現有資料庫限制，更清楚呈現基因在編輯中的角色，提升基因排序效率，幫助設計更好的基因編輯實驗。相關工具和資料已在GitHub公開。 PubMed DOI

Harnessing the Power of Large Language Models (LLMs) to Unravel the Influence of Genes and Medications on Biological Processes of Wound Healing.
運用大型語言模型（LLMs）解析基因與藥物對傷口癒合生物過程的影響 AMIA Annu Symp Proc 2025-05-26

這項研究用 GPT-3.5 和 GPT-4 來分析科學文獻，找出基因和藥物對傷口癒合的影響。結果發現，GPT-4 在辨識和萃取這些關係上比 GPT-3.5 更準確，顯示 GPT-4 不用再訓練就能有效協助生醫研究。 PubMed

Large Language Models in Genomics-A Perspective on Personalized Medicine.
基因體學中的大型語言模型——個人化醫療的觀點 Bioengineering (Basel) 2025-05-28

大型語言模型正改變基因體醫療，能快速分析文獻和基因資料，提升診斷與治療建議的精準度。雖然還有挑戰待克服，但隨著技術進步和跨領域合作，未來 AI 將成為臨床基因體分析的主流工具，推動個人化醫療發展。 PubMed DOI

Knowledge-guided Contextual Gene Set Analysis Using Large Language Models.
利用大型語言模型進行知識導向的情境基因集分析 ArXiv 2025-06-12

cGSA 是新一代 AI 基因集分析工具，運用大型語言模型，能針對特定疾病情境，精準排序相關路徑，減少雜訊和重複結果。實驗證明，cGSA 比傳統方法更有效，讓研究人員更容易找出有意義的生物學假說。 PubMed

原始文章

站上相關主題文章列表