原始文章

馬鈴薯基因-疾病知識庫(PotatoG-DKB)旨在協助研究人員獲取和整理馬鈴薯基因與疾病的相關資訊。這個專案運用自然語言處理和大型語言模型,從2,906篇PubMed文章中提取數據,建立了包含22種實體類型的知識庫,涵蓋5,206個節點和9,443條關係。還推出了互動式可視化平台——馬鈴薯基因-疾病知識入口(PotatoG-DKP),幫助生物學家和育種者深入了解馬鈴薯的致病機制及抗病性。更多資訊可至 https://www.potatogd.com.cn/ 查詢。 PubMed DOI


站上相關主題文章列表

GPAD是利用自然語言處理技術開發的工具,可從OMIM資料庫中提取基因與疾病的關聯。它能找出基因與特定表現型的關聯,並驗證類型。研究指出,外顯子定序增加了GDA的發現數,但因研究群體需求增加,發現率下降。此工具強調利用斑馬魚和果蠅等模式生物支持GDA的重要性。使用GPAD進行即時分析有助於研究計畫制定。 PubMed DOI

植物基因組學有重大進展,透過高通量方法研究多種基因組範圍的分子表現型。這有助於深入了解植物特徵和遺傳機制,尤其是在模式植物物種中。為了提升作物基因組學,準確預測至關重要。AgroNT是一個大型語言模型,經過48種植物物種基因組的訓練,專注於作物物種,能進行最先進的基因組特徵預測。一項針對木薯突變的研究顯示AgroNT評估調控影響的能力。編製的數據集可作為植物基因組學中深度學習方法的參考。預先訓練的AgroNT模型可在HuggingFace上進行進一步研究。 PubMed DOI

阿茲海默症是個嚴重問題,目前沒有效治療。知識圖被用在生醫研究,找出AD的藥物再利用和生物標記。一研究建立了針對AD的知識圖,分析AD、基因、變異、化學物質、藥物和其他疾病的互動。透過對PubMed摘要註釋和AI文本擴增,訓練了數據挖掘模型,提取關係。建立了全面的阿茲海默症知識圖,整合其他數據庫,訓練知識圖嵌入模型,有助於改進AD研究和治療。 PubMed DOI

微小RNA(miRNAs)在調控人類疾病中扮演重要角色,常與多種疾病相關,甚至可作為生物標記。儘管如此,miRNA的多效性概念仍不被廣泛理解。為了解決這個問題,我們推出了miRAIDD(miRNA人工智慧疾病資料庫),這是一個全面的資源,記錄miRNA與疾病的因果關聯,並利用大型語言模型進行開發。我們的貢獻包括系統量化miRNA的多效性及探討其生物學特徵,並分享程式碼和資料庫,促進研究進展。 PubMed DOI

個人化醫療透過個體特徵,特別是基因資料,來制定治療方案。研究顯示特定基因背景與藥物的劑量和副作用有關。傳統知識系統難以處理這些複雜數據,因此我們開發了CPMKG,一個全面的知識平台,整理了307,614條與藥物、疾病和基因相關的資料,分為四大類別:藥物副作用、敏感性、機制和適應症。CPMKG支援藥物中心探索和病症知識推理,並整合大型語言模型,提供易懂的數據解釋,是臨床研究的重要資源。欲了解更多,請訪問:https://www.biosino.org/cpmkg/. PubMed DOI

在科學研究中,隨著出版物數量的增加,管理變得愈加困難。為了解決這個問題,我們開發了一個高通量流程,利用ChatGPT從超過24,000篇秀麗隱杆線蟲和150,000篇果蠅的文獻中提取資訊,成功識別了超過200,000個C. elegans的互動及近120萬個果蠅的互動,建立了全面的生物圖譜。我們還創建了一個可搜尋的線上平台,方便使用者訪問這些知識網絡,並突顯了重要的生物途徑。這些數據庫可在worm.bio-map.com和drosophila.bio-map.com訪問。 PubMed DOI

罕見疾病影響全球數百萬人,但因為盛行率低,研究關注有限,且缺乏特定的 ICD 代碼,讓臨床試驗中的患者識別變得困難。為了解決這個問題,我們開發了名為自動化罕見疾病挖掘(AutoRD)的系統,能自動提取醫學文本中的罕見疾病資訊。AutoRD 整合了醫學知識圖譜,並在實體和關係提取上表現優異,特別是在罕見疾病實體提取上達到 83.5% 的 F1 分數,顯示出其在醫療保健轉型中的潛力。 PubMed DOI

隨著生物醫學文獻的快速增長,使用大型語言模型(LLMs)來理解精準醫療變得越來越重要。然而,現有方法在提取複雜生物關係時面臨可靠性和可擴展性等挑戰。為了解決這些問題,我們提出了LORE,一種創新的無監督兩階段閱讀方法,將文獻視為可驗證的知識圖譜,並以語義嵌入表示。應用於PubMed摘要時,LORE能有效捕捉基因致病性信息,並在識別疾病相關基因方面達到90%的精確度,為研究人員提供了新的潛在治療靶點識別途徑。 PubMed DOI

基因編輯(GE)是生命科學中的重要工具,但因物種、基因序列及工具不同,編輯某些基因會遇到挑戰。為了提升基因編輯研究的設計,確認文獻中基因編輯的實踐至關重要。基因編輯元數據庫(GEM)提供了有用的資訊,但對特定基因的參與細節仍不足。 本研究開發了一種系統性方法,利用大型語言模型從GEM及相關文獻中提取關鍵資訊,讓基因編輯數據的調查更全面。我們還提出將這些資訊轉換為指標,以優先考慮未來的研究基因。最終的基因編輯資訊和評分系統旨在簡化目標基因的選擇,改善研究設計。欲了解更多,請訪問以下網址:https://github.com/szktkyk/extract_geinfo 和 https://github.com/szktkyk/visualize_geinfo。 PubMed DOI

這項研究開發了一個高通量流程,利用OpenAI的GPT模型自動從生物醫學文獻中提取基因功能資訊。研究人員針對酵母菌(Saccharomyces cerevisiae)和裂殖酵母(Schizosaccharomyces pombe)進行分析,識別出數百萬個基因功能相關的關係。結果整理成一個可搜尋的線上知識圖譜資料庫,網址為yeast.connectome.tools和spombe.connectome.tools,提供深入的互動和途徑見解,展現人工智慧與生物資訊學結合的潛力,並為其他生物系統的應用提供可擴展的方法。 PubMed DOI