原始文章

這項研究針對生物醫學領域的基因集、網絡和途徑分析,提出了一種新方法todenE(基於拓撲和密度的集成聚類)。此方法解決了途徑和基因列表中的冗餘問題,並透過元數據豐富PAGs以更好地反映生物功能。研究人員建立了PAG-PAG網絡,並利用大型語言模型來捕捉功能信息。引入的差異指數(DI)用於評估基因鄰居的連通性,並比較不同聚類算法的效果,最終形成Super-PAGs,顯示出更佳的語義相關性和基因包容性。 PubMed DOI


站上相關主題文章列表

這項研究評估了21個大型語言模型(LLMs)在檢索生物知識的有效性,特別針對基因調控和KEGG途徑。隨著生物文獻的快速增長,傳統手動整理已不再足夠,LLMs成為一個有前景的替代方案。 結果顯示,模型性能差異明顯,GPT-4和Claude-Pro在基因調控關係的F1分數分別為0.4448和0.4386,KEGG途徑的Jaccard指數也表現強勁。相比之下,開源模型表現較差。研究強調選擇合適模型的重要性,並提供了LLMs在生物研究中的應用見解,相關代碼已在GitHub上公開。 PubMed DOI

這項研究評估了五種大型語言模型(LLMs)在識別基因集共同功能的有效性,並探討現有基因功能數據庫的限制。結果顯示,GPT-4在73%的案例中提出的功能與整理的基因集名稱相符,且其自信度與準確性相關。相比之下,隨機基因集的零自信率高達87%。其他模型如GPT-3.5和Gemini Pro則表現不一,經常在隨機基因集上出現錯誤自信。GPT-4在分析組學數據的基因簇時,識別出共同功能的案例達45%,顯示其在特異性和基因覆蓋率上優於傳統方法,顯示LLMs在組學研究中的潛力。 PubMed DOI

空間轉錄組學是理解組織細胞組成的重要工具,尤其在癌症研究中,腫瘤微環境至關重要。然而,數據的複雜性使解釋變得困難。本研究探討大型語言模型(LLMs)在分析小鼠黑色素瘤模型的空間轉錄組數據的應用。研究發現Claude 3.5 Sonnet在斑點量化和模式識別上表現最佳,並開發出系統化工作流程,幫助分析腫瘤免疫景觀。該模型揭示了免疫抑制機制,並顯示LLMs在空間轉錄組學中的潛力,能有效提升數據解釋的能力。 PubMed DOI

單細胞多組學技術,特別是單細胞RNA測序(scRNA-seq),讓我們更深入了解細胞的多樣性與發展。透過將基因視為單詞,並利用word2vec技術生成基因的向量表示,我們能夠進行多尺度分析,識別細胞狀態與發展軌跡。這種方法不僅計算效率高,還能在不依賴高效能計算集群的情況下進行分析,成為探索細胞發展、基因影響及組織關係的重要工具。 PubMed DOI

這項研究提出了一個新穎的流程,結合大型語言模型(LLMs)與人類專家的知識,來優先排序特定的漿細胞相關基因。流程分為兩步: 1. **高通量篩選**:利用LLMs對17個基因進行評分,最終選出五個候選基因:CD38、TNFRSF17、IGJ、TOP2A和TYMS。 2. **人類增強驗證**:專家精煉評分,確認CD38和TNFRSF17為最佳候選基因。 分析轉錄組數據後,CD38被確定為最佳選擇,TNFRSF17和IGJ則是有潛力的替代選擇。這項研究展示了結合知識與數據的方法,適用於各種生物學背景。 PubMed DOI

這項研究提出了一個新框架,結合大型語言模型(LLMs)提取的臨床特徵,以改善癌症亞型的分類。傳統方法多只專注於組學數據,忽略了臨床背景的價值。研究利用基於BERT的模型,從病理報告中提取結構化特徵,並與組學數據結合,透過自編碼器增強信息。經過奇異值分解(SVD)和光譜聚類後,結果顯示在六個癌症數據集上表現優於現有方法,強調了臨床特徵在多組學分析中的重要性,並展示了LLMs在精準醫療中的潛力。 PubMed DOI

這篇論文提出一種結合GCN、Transformer和BERT的新型空間多尺度圖卷積網路(SGTB),用來分析空間轉錄體學資料。這方法能同時抓住細胞的局部和全域空間關聯,並用BERT提升語意表現,讓細胞分類和基因調控網路建構等任務更精準有效。 PubMed DOI

Ontolomics-P 是一款操作簡單的網頁工具,專門分析蛋白質體學資料。它用 LDA 主題建模、GO 語意相似度和 GPT-4o 再註解,能把複雜的生物功能整理成清楚易懂的主題,還整合 10 種癌症的蛋白質資料,讓分析更全面、結果更好懂,幫助推動蛋白質體學研究。 PubMed DOI

傳統基因集分析彈性有限,llm2geneset 利用大型語言模型,能根據基因和自然語言描述,動態產生專屬基因集,品質媲美甚至超越人工整理。這工具在解析高通量資料和找生物過程上,比傳統方法更有效。llm2geneset 已開源,網路上可免費取得。 PubMed DOI

cGSA 是新一代 AI 基因集分析工具,運用大型語言模型,能針對特定疾病情境,精準排序相關路徑,減少雜訊和重複結果。實驗證明,cGSA 比傳統方法更有效,讓研究人員更容易找出有意義的生物學假說。 PubMed