原始文章

這項研究針對生物醫學領域的基因集、網絡和途徑分析,提出了一種新方法todenE(基於拓撲和密度的集成聚類)。此方法解決了途徑和基因列表中的冗餘問題,並透過元數據豐富PAGs以更好地反映生物功能。研究人員建立了PAG-PAG網絡,並利用大型語言模型來捕捉功能信息。引入的差異指數(DI)用於評估基因鄰居的連通性,並比較不同聚類算法的效果,最終形成Super-PAGs,顯示出更佳的語義相關性和基因包容性。 PubMed DOI


站上相關主題文章列表

分子生物學家常用統計豐富分析研究基因列表,了解基因生物功能。新方法SPINDOCTOR利用大型語言模型(LLMs)如GPT總結基因集功能,不需Gene Ontology等知識庫。雖然SPINDOCTOR能生成符合生物學要求的基因功能摘要,但在提供可靠統計分數方面有困難,可能無法像標準豐富分析那樣精確。結果顯示,仍需手動編輯本體信息,LLM方法尚未完全取代傳統分析技術。 PubMed DOI

功能基因組學研究利用OpenAI的GPT-4模型快速生成基因功能假說,開發了標記基因集名稱的流程,支援文本分析和引文。GPT-4表現優異,提供比傳統方法更豐富的資訊,經人工審查後確認可信度。顯示大型語言模型在功能基因組學研究中有潛力。 PubMed DOI

本研究使用OpenAI的GPT-4大型語言模型,評估其在功能基因組學中的應用價值。結果顯示,GPT-4能夠生成具有生物醫學知識的基因功能假設,並提供比傳統方法更豐富的資訊。這顯示大型語言模型在功能基因組學研究中具有潛力成為有用的工具。 PubMed DOI

研究使用大型語言模型(LLMs)探討基於知識的基因優先順序和選擇,專注於與紅血球特徵相關的血液轉錄模組。結果顯示,OpenAI的GPT-4和Anthropic的Claude在LLMs中表現最佳。研究找出了模組M9.2的頂尖基因候選者,顯示LLMs在基因選擇上的潛力,有助於提升生物醫學知識的應用價值。 PubMed DOI

研究比較了21個大型語言模型(LLMs)在自動文本挖掘生物途徑的效能,專注於基因調控和KEGG途徑辨識。結果顯示,各模型表現不同,像是ChatGPT-4和Claude-Pro這類基於API的模型表現比開源模型好。LLMs在生物醫學研究中有潛力,可用於基因網絡分析和途徑對應,但因性能不同,選擇適合的模型至關重要。 PubMed DOI

BioNexusSentinel是一個用於RNA-seq和生物調控網絡探索的軟體平台,整合了視覺工具和Reactome生物模型。它包括基因表達分析器和細胞組織RNA-seq探索器,提高研究生產力,並在網絡建模和生物狀態分析中有應用。該項目在GitHub上可找到。 PubMed DOI

MedicoVerse 是一個針對製藥產業法規文件進行摘要的解決方案,運用先進的機器學習技術。它採用多階段流程,包括詞嵌入、聚類和摘要生成。首先,利用 SapBERT 模型創建嵌入,接著用層次聚合聚類方法組織這些嵌入,最後使用 bart-large-cnn-samsum 模型對每個聚類進行摘要,並合併成綜合概述。與 T5、Google Pegasus 等模型比較後,MedicoVerse 在 ROUGE 分數、BERTScore 等評估標準上表現更佳,提供更具資訊性的摘要。 PubMed DOI

這項研究評估了21個大型語言模型(LLMs)在檢索生物知識的有效性,特別針對基因調控和KEGG途徑。隨著生物文獻的快速增長,傳統手動整理已不再足夠,LLMs成為一個有前景的替代方案。 結果顯示,模型性能差異明顯,GPT-4和Claude-Pro在基因調控關係的F1分數分別為0.4448和0.4386,KEGG途徑的Jaccard指數也表現強勁。相比之下,開源模型表現較差。研究強調選擇合適模型的重要性,並提供了LLMs在生物研究中的應用見解,相關代碼已在GitHub上公開。 PubMed DOI

GPTON 利用 GPT-4 來強化本體敘述,將結構化知識轉換為語言,並將本體術語整合進大型語言模型中。這種方法使得超過 68% 的基因集在前五名預測中能獲得準確的文本和本體註釋。手動評估證實了 GPTON 的有效性,顯示它如何運用 LLMs 和結構化知識,對生物醫學研究做出重要貢獻,超越了基因集的註釋範疇。 PubMed DOI

研究蛋白質-蛋白質相互作用(PPIs)對於理解生物過程非常重要,尤其是在抗體與抗原、酶與抑制劑或促進劑的互動上。近期針對PPIs的研究,特別是與SARS-CoV-2的關聯,推動了疫苗的開發。雖然已有數據庫整理PPI網絡,但文本挖掘方法在新研究或少數物種中顯得尤為重要。比較不同的自然語言處理(NLP)工具後發現,傳統方法真陽性率高但網絡過度連接,機器學習方法則網絡結構相似但真陽性率低,而大型語言模型的表現則介於兩者之間。選擇合適的NLP方法需根據研究需求和文本量。 PubMed DOI