原始文章

馬鈴薯基因-疾病知識庫(PotatoG-DKB)旨在協助研究人員獲取和整理馬鈴薯基因與疾病的相關資訊。這個專案運用自然語言處理和大型語言模型,從2,906篇PubMed文章中提取數據,建立了包含22種實體類型的知識庫,涵蓋5,206個節點和9,443條關係。還推出了互動式可視化平台——馬鈴薯基因-疾病知識入口(PotatoG-DKP),幫助生物學家和育種者深入了解馬鈴薯的致病機制及抗病性。更多資訊可至 https://www.potatogd.com.cn/ 查詢。 PubMed DOI


站上相關主題文章列表

阿茲海默症是個嚴重問題,目前沒有效治療。知識圖被用在生醫研究,找出AD的藥物再利用和生物標記。一研究建立了針對AD的知識圖,分析AD、基因、變異、化學物質、藥物和其他疾病的互動。透過對PubMed摘要註釋和AI文本擴增,訓練了數據挖掘模型,提取關係。建立了全面的阿茲海默症知識圖,整合其他數據庫,訓練知識圖嵌入模型,有助於改進AD研究和治療。 PubMed DOI

個人化醫療透過個體特徵,特別是基因資料,來制定治療方案。研究顯示特定基因背景與藥物的劑量和副作用有關。傳統知識系統難以處理這些複雜數據,因此我們開發了CPMKG,一個全面的知識平台,整理了307,614條與藥物、疾病和基因相關的資料,分為四大類別:藥物副作用、敏感性、機制和適應症。CPMKG支援藥物中心探索和病症知識推理,並整合大型語言模型,提供易懂的數據解釋,是臨床研究的重要資源。欲了解更多,請訪問:https://www.biosino.org/cpmkg/. PubMed DOI

罕見疾病影響全球數百萬人,但因為盛行率低,研究關注有限,且缺乏特定的 ICD 代碼,讓臨床試驗中的患者識別變得困難。為了解決這個問題,我們開發了名為自動化罕見疾病挖掘(AutoRD)的系統,能自動提取醫學文本中的罕見疾病資訊。AutoRD 整合了醫學知識圖譜,並在實體和關係提取上表現優異,特別是在罕見疾病實體提取上達到 83.5% 的 F1 分數,顯示出其在醫療保健轉型中的潛力。 PubMed DOI

隨著生物醫學文獻的快速增長,使用大型語言模型(LLMs)來理解精準醫療變得越來越重要。然而,現有方法在提取複雜生物關係時面臨可靠性和可擴展性等挑戰。為了解決這些問題,我們提出了LORE,一種創新的無監督兩階段閱讀方法,將文獻視為可驗證的知識圖譜,並以語義嵌入表示。應用於PubMed摘要時,LORE能有效捕捉基因致病性信息,並在識別疾病相關基因方面達到90%的精確度,為研究人員提供了新的潛在治療靶點識別途徑。 PubMed DOI

基因編輯(GE)是生命科學中的重要工具,但因物種、基因序列及工具不同,編輯某些基因會遇到挑戰。為了提升基因編輯研究的設計,確認文獻中基因編輯的實踐至關重要。基因編輯元數據庫(GEM)提供了有用的資訊,但對特定基因的參與細節仍不足。 本研究開發了一種系統性方法,利用大型語言模型從GEM及相關文獻中提取關鍵資訊,讓基因編輯數據的調查更全面。我們還提出將這些資訊轉換為指標,以優先考慮未來的研究基因。最終的基因編輯資訊和評分系統旨在簡化目標基因的選擇,改善研究設計。欲了解更多,請訪問以下網址:https://github.com/szktkyk/extract_geinfo 和 https://github.com/szktkyk/visualize_geinfo。 PubMed DOI

這項研究開發了一個高通量流程,利用OpenAI的GPT模型自動從生物醫學文獻中提取基因功能資訊。研究人員針對酵母菌(Saccharomyces cerevisiae)和裂殖酵母(Schizosaccharomyces pombe)進行分析,識別出數百萬個基因功能相關的關係。結果整理成一個可搜尋的線上知識圖譜資料庫,網址為yeast.connectome.tools和spombe.connectome.tools,提供深入的互動和途徑見解,展現人工智慧與生物資訊學結合的潛力,並為其他生物系統的應用提供可擴展的方法。 PubMed DOI

這項研究推出GDReCo語料庫和本體框架,專門用來提升基因與疾病關聯的文本擷取,解決NLP模型訓練資料不足的問題。GDReCo收錄超過2.4萬筆案例,結合人工與模型標註。用BERT訓練後,模型能更準確擷取基因-疾病關聯,對生醫研究很有幫助,但像ChatGPT這類模型在細節擷取上還是有難度。 PubMed DOI

這項研究用大型語言模型,從GEM資料庫和文獻中自動萃取基因編輯細節,突破了原本資料庫的限制。這讓研究人員能更快找到重要基因、規劃實驗,提升基因編輯研究效率。相關工具和資料已在GitHub公開,方便大家使用。 PubMed DOI

研究團隊整合生醫文獻和資料庫,建立阿茲海默症知識圖譜(ADKG),用NLP技術捕捉AD相關基因、藥物等複雜關聯。經ADKG訓練的模型能預測新關聯,並結合UK Biobank資料後,提升AD預測準確度。ADKG有助於加速治療與診斷發現,推動阿茲海默症精準醫療發展。 PubMed DOI

這項研究用大型語言模型,從GEM資料庫和文獻中自動萃取、量化基因編輯資訊,突破現有資料庫限制,更清楚呈現基因在編輯中的角色,提升基因排序效率,幫助設計更好的基因編輯實驗。相關工具和資料已在GitHub公開。 PubMed DOI