原始文章

作者提出 cxt 深度學習模型,採用 transformer 架構,能從基因體資料推斷共祖時間。不同於傳統機率模型,cxt 直接從模擬資料學習,將突變「翻譯」成祖先重組圖。其準確度與現有方法相當甚至更佳,泛化能力強、易於擴展,還能提供預測不確定性,為族群遺傳推論帶來更靈活且大規模的應用新方向。 PubMed DOI


站上相關主題文章列表

在分子生物學中,探索分子間的關聯性至關重要,而大型語言模型(LLMs)的出現大幅推進了這一領域。這些模型在自然語言處理和圖像生成上表現優異,能夠從龐大數據集中捕捉複雜關係,成為基礎模型。 目前的數據集涵蓋RNA、DNA、蛋白質序列及單細胞和空間轉錄組,為模型開發提供了豐富基礎。未來,基礎模型的發展將專注於提升可解釋性、整合多組學數據及增強預測能力,對於改進我們對生物系統的理解及治療策略具有巨大潛力。 PubMed DOI

大型語言模型(LLMs)正在改變生物醫學科學,特別是在理解生物序列方面。基因組語言模型(gLMs)專注於DNA序列,能幫助預測基因組中重要的功能區域、設計新DNA序列,並促進轉移學習。儘管如此,開發有效的gLMs仍面臨挑戰,如數據質量、模型架構及評估指標等。解決這些問題對於gLMs在複雜生物系統中的應用至關重要。 PubMed DOI

這段文字介紹了一種新型的DNA序列比對方法,稱為「Embed-Search-Align」(ESA) 框架。它利用無參考DNA嵌入的Transformer模型,生成DNA讀取和參考片段的向量嵌入。ESA的創新包括對比損失自我監督訓練,提升DNA序列的表徵,以及高效的DNA向量儲存,促進全球搜尋。RDE模型在比對250長度的DNA讀取時達到99%準確率,超越傳統方法,顯示出在基因組任務中的穩健性和多樣性。如需更多資訊,請參考提供的連結。 PubMed DOI

Omics 資料量暴增,超出現有分析能力,但大型語言模型(LLMs)能解決這問題。透過多模態基礎模型預訓練,可有效解析基因體、轉錄體等多元資料,應用於細胞分類、生物標記發現、基因調控等,推動 AI 驅動的生物研究,深入了解生命科學。 PubMed DOI

基因體語言模型(gLMs)像 Evo2,規模已達頂尖文字 LLMs 等級,成為解讀 DNA 的新利器。本文回顧 gLMs 的發展,重點介紹 Evo2 的突破,並探討其在科學研究的潛力及醫療應用上遇到的挑戰。 PubMed DOI

這項研究結合超過350萬名病患的基因和臨床資料,利用機器學習大幅提升基因變異分類的準確度,特別針對過去意義不明的變異。新開發的臨床變異模型成功重新分類數千個VUS,讓不確定的檢測結果減少9–49%。這證明日常臨床資料能有效協助基因檢測,對病患和醫師都很有幫助。 PubMed DOI

大型語言模型(LLMs)能根據病人表現型有效排序相關基因,表現不輸甚至優於傳統生物資訊方法。LLMs 有潛力協助罕見遺傳疾病診斷,提升準確度並簡化流程,成為未來診斷新選擇。 PubMed DOI

大型語言模型正改變基因體醫療,能快速分析文獻和基因資料,提升診斷與治療建議的精準度。雖然還有挑戰待克服,但隨著技術進步和跨領域合作,未來 AI 將成為臨床基因體分析的主流工具,推動個人化醫療發展。 PubMed DOI

大型語言模型(LLMs)在自然語言處理很強,但在植物育種的應用還有很大發展空間。這篇綜述說明LLMs能協助分析複雜生物資料、預測重要性狀,並整合基因體和環境等多元資料,有助於提升基因發現和決策效率。文章也討論目前進展、挑戰及未來展望,期望推動永續農業與糧食安全。 PubMed DOI

這項研究利用先進的transformer模型(DNABERT-2和Nucleotide Transformer),有效區分癌症與非癌症基因突變。團隊結合真實與合成資料訓練,解決資料不平衡問題。結果顯示,這方法在各項指標上都比現有模型更優秀,有助提升基因分析準確度,未來有望推動個人化癌症治療發展。 PubMed DOI