原始文章

馬鈴薯基因-疾病知識庫(PotatoG-DKB)旨在協助研究人員獲取和整理馬鈴薯基因與疾病的相關資訊。這個專案運用自然語言處理和大型語言模型,從2,906篇PubMed文章中提取數據,建立了包含22種實體類型的知識庫,涵蓋5,206個節點和9,443條關係。還推出了互動式可視化平台——馬鈴薯基因-疾病知識入口(PotatoG-DKP),幫助生物學家和育種者深入了解馬鈴薯的致病機制及抗病性。更多資訊可至 https://www.potatogd.com.cn/ 查詢。 PubMed DOI


站上相關主題文章列表

GPAD是利用自然語言處理技術開發的工具,可從OMIM資料庫中提取基因與疾病的關聯。它能找出基因與特定表現型的關聯,並驗證類型。研究指出,外顯子定序增加了GDA的發現數,但因研究群體需求增加,發現率下降。此工具強調利用斑馬魚和果蠅等模式生物支持GDA的重要性。使用GPAD進行即時分析有助於研究計畫制定。 PubMed DOI

植物基因組學有重大進展,透過高通量方法研究多種基因組範圍的分子表現型。這有助於深入了解植物特徵和遺傳機制,尤其是在模式植物物種中。為了提升作物基因組學,準確預測至關重要。AgroNT是一個大型語言模型,經過48種植物物種基因組的訓練,專注於作物物種,能進行最先進的基因組特徵預測。一項針對木薯突變的研究顯示AgroNT評估調控影響的能力。編製的數據集可作為植物基因組學中深度學習方法的參考。預先訓練的AgroNT模型可在HuggingFace上進行進一步研究。 PubMed DOI

阿茲海默症是個嚴重問題,目前沒有效治療。知識圖被用在生醫研究,找出AD的藥物再利用和生物標記。一研究建立了針對AD的知識圖,分析AD、基因、變異、化學物質、藥物和其他疾病的互動。透過對PubMed摘要註釋和AI文本擴增,訓練了數據挖掘模型,提取關係。建立了全面的阿茲海默症知識圖,整合其他數據庫,訓練知識圖嵌入模型,有助於改進AD研究和治療。 PubMed DOI

微小RNA(miRNAs)在調控人類疾病中扮演重要角色,常與多種疾病相關,甚至可作為生物標記。儘管如此,miRNA的多效性概念仍不被廣泛理解。為了解決這個問題,我們推出了miRAIDD(miRNA人工智慧疾病資料庫),這是一個全面的資源,記錄miRNA與疾病的因果關聯,並利用大型語言模型進行開發。我們的貢獻包括系統量化miRNA的多效性及探討其生物學特徵,並分享程式碼和資料庫,促進研究進展。 PubMed DOI

GENEVIC是一個由人工智慧驅動的聊天框架,旨在簡化基因數據的分析與知識發現。它能自動檢索、分析和可視化基因資訊,協助生物學家。主要功能包括生成蛋白質互作網絡、豐富基因集,並從PubMed和Google Scholar搜尋文獻。試點階段專注於阿茲海默症、精神分裂症及認知相關基因變異,幫助研究人員優先考慮重要變異。這個平台使用簡單,無需專業訓練,並在安全的HIPAA合規環境中運行,且代碼開源,促進基因研究的合作與發展。 PubMed DOI

個人化醫療透過個體特徵,特別是基因資料,來制定治療方案。研究顯示特定基因背景與藥物的劑量和副作用有關。傳統知識系統難以處理這些複雜數據,因此我們開發了CPMKG,一個全面的知識平台,整理了307,614條與藥物、疾病和基因相關的資料,分為四大類別:藥物副作用、敏感性、機制和適應症。CPMKG支援藥物中心探索和病症知識推理,並整合大型語言模型,提供易懂的數據解釋,是臨床研究的重要資源。欲了解更多,請訪問:https://www.biosino.org/cpmkg/. PubMed DOI

這項研究評估了21個大型語言模型(LLMs)在檢索生物知識的有效性,特別針對基因調控和KEGG途徑。隨著生物文獻的快速增長,傳統手動整理已不再足夠,LLMs成為一個有前景的替代方案。 結果顯示,模型性能差異明顯,GPT-4和Claude-Pro在基因調控關係的F1分數分別為0.4448和0.4386,KEGG途徑的Jaccard指數也表現強勁。相比之下,開源模型表現較差。研究強調選擇合適模型的重要性,並提供了LLMs在生物研究中的應用見解,相關代碼已在GitHub上公開。 PubMed DOI

基因組時代的來臨促進了高通量數據和先進計算方法的發展,幫助我們探索植物抗逆境的遺傳與功能。儘管有許多實驗和分析技術,但龐大的數據量仍帶來挑戰。深度學習模型在預測基因結構和功能方面表現優異,並在農業高通量表型學中越來越常見。這篇綜述強調了數據資源和生物信息學工具,以及機器學習和人工智慧在植物抗逆境研究中的應用,並展示如何利用大型語言模型(如ChatGPT)創建相關知識圖譜,促進跨領域合作。 PubMed DOI

在科學研究中,隨著出版物數量的增加,管理變得愈加困難。為了解決這個問題,我們開發了一個高通量流程,利用ChatGPT從超過24,000篇秀麗隱杆線蟲和150,000篇果蠅的文獻中提取資訊,成功識別了超過200,000個C. elegans的互動及近120萬個果蠅的互動,建立了全面的生物圖譜。我們還創建了一個可搜尋的線上平台,方便使用者訪問這些知識網絡,並突顯了重要的生物途徑。這些數據庫可在worm.bio-map.com和drosophila.bio-map.com訪問。 PubMed DOI

基因功能的研究仍是植物科學的重要目標,但在模式生物阿拉伯芥中,只有約15%的基因功能經過實驗驗證。雖然生物資訊工具能幫助預測基因功能,但近年來有效性和實驗性基因數量並未顯著增加。這篇綜述將探討基因功能研究的現狀與未來方向,並強調預測技術的最新進展。此外,還會討論人工智慧的發展,特別是大型語言模型和知識圖譜,如何提升基因功能預測,幫助研究人員隨時掌握最新科學文獻。 PubMed DOI