原始文章

傳統基因集分析彈性有限,llm2geneset 利用大型語言模型,能根據基因和自然語言描述,動態產生專屬基因集,品質媲美甚至超越人工整理。這工具在解析高通量資料和找生物過程上,比傳統方法更有效。llm2geneset 已開源,網路上可免費取得。 PubMed DOI


站上相關主題文章列表

大型語言模型(LLMs)正在改變生物醫學科學,特別是在理解生物序列方面。基因組語言模型(gLMs)專注於DNA序列,能幫助預測基因組中重要的功能區域、設計新DNA序列,並促進轉移學習。儘管如此,開發有效的gLMs仍面臨挑戰,如數據質量、模型架構及評估指標等。解決這些問題對於gLMs在複雜生物系統中的應用至關重要。 PubMed DOI

隨著生物醫學文獻的快速增長,使用大型語言模型(LLMs)來理解精準醫療變得越來越重要。然而,現有方法在提取複雜生物關係時面臨可靠性和可擴展性等挑戰。為了解決這些問題,我們提出了LORE,一種創新的無監督兩階段閱讀方法,將文獻視為可驗證的知識圖譜,並以語義嵌入表示。應用於PubMed摘要時,LORE能有效捕捉基因致病性信息,並在識別疾病相關基因方面達到90%的精確度,為研究人員提供了新的潛在治療靶點識別途徑。 PubMed DOI

這段文字探討了在對生物文本,特別是表型描述進行註釋時的挑戰,尤其是使用本體詞彙的情況。傳統文本挖掘工具在理解上下文方面表現不佳,而像OpenAI的GPT這類大型語言模型則更適合需要語義理解的任務。作者提出利用GPT對*Arabidopsis thaliana*和森林樹木的表型觀察進行本體詞彙註釋,目標是達到與人工註釋相當的效果。這些流程包括將表型解析為簡潔概念,並使用嵌入向量相似度和檢索增強生成(RAG)方法來識別合適的本體詞彙,最終實現高準確度的自動註釋。 PubMed DOI

**重點摘要:** 這項研究介紹了一個名為 GeneRxGPT 的工具,它結合了大型語言模型(LLMs)和最新的生醫文獻,讓癌症研究人員可以更輕鬆地發現藥物與基因之間的關係、找出新的治療標的、藥物再利用,以及更深入了解複雜的分子交互作用——而且不需要具備進階的電腦運算技能。 PubMed DOI

大型語言模型(LLMs)能根據病人表現型有效排序相關基因,表現不輸甚至優於傳統生物資訊方法。LLMs 有潛力協助罕見遺傳疾病診斷,提升準確度並簡化流程,成為未來診斷新選擇。 PubMed DOI

這項研究發現,大型語言模型(LLMs)能自動從文本中擷取蛋白質交互等分子資料,表現比人工處理更有效率。雖然在部分基因細節上還有困難,但整體來說,LLMs有助於加速生物知識的發現與應用。 PubMed DOI

大型語言模型正改變基因體醫療,能快速分析文獻和基因資料,提升診斷與治療建議的精準度。雖然還有挑戰待克服,但隨著技術進步和跨領域合作,未來 AI 將成為臨床基因體分析的主流工具,推動個人化醫療發展。 PubMed DOI

cGSA 是新一代 AI 基因集分析工具,運用大型語言模型,能針對特定疾病情境,精準排序相關路徑,減少雜訊和重複結果。實驗證明,cGSA 比傳統方法更有效,讓研究人員更容易找出有意義的生物學假說。 PubMed

這篇研究用微調過的GPT大型語言模型,來自動把生物樣本標籤對應到本體論術語,減少人工註解負擔。實驗結果顯示,GPT模型在細胞株和細胞類型的召回率高達88–97%,但精確度只有47–64%。雖然能提升註解效率,但精確度還有進步空間,專家審查仍不可少。 PubMed DOI

罕見疾病診斷困難,因資料少且基因多樣。本研究評估大型語言模型(LLMs)在基因排序的表現,發現GPT-4表現最佳,但對知名基因有偏好且受輸入順序影響。採用分批處理可提升準確度並減少偏誤,有助加快罕見疾病基因鑑定與診斷。程式碼可在 GitHub 下載。 PubMed DOI