原始文章

BASIL DB 是一個線上知識圖譜資料庫,整理超過 43,000 篇論文,結合食物、生物活性化合物和健康效益的資訊。它用自然語言處理技術,讓使用者能互動式查詢食物與健康的關聯,對營養學和疾病預防研究很有幫助。 PubMed DOI


站上相關主題文章列表

功能性蛋白質組學在癌症研究中非常重要,能幫助識別新的生物標記和治療目標。我們建立了一個全面的資源,包含近8,000名癌症患者和約900個癌症細胞系的數據,並挑選了近500種高品質抗體,涵蓋主要癌症通路。為了提升可用性,我們推出了DrBioRight 2.0(https://drbioright.org),這是一個直觀的生物資訊平台,結合大型語言模型,讓研究人員能深入分析和視覺化蛋白質組學數據,加速轉化為生物醫學見解。 PubMed DOI

這篇論文提出了一個針對糖尿病患者的智能問答系統,目的是提供個人化的醫療資訊。系統結合大型語言模型與知識圖譜,克服傳統醫療系統的限制。使用Neo4j的知識圖譜,並結合Baichuan2-13B和Qwen2.5-7B模型,透過低秩適應和提示學習技術提升性能。評估結果顯示,實體識別精確度達85.91%,意圖分類達88.55%。這項研究顯示結合大型語言模型與知識圖譜的潛力,為未來個人化醫療解決方案提供了新方向。 PubMed DOI

這項研究專注於利用先進的檢索增強生成(RAG)系統,結合更新版的膳食補充品知識庫2.0(iDISK2.0),提升膳食補充品資訊的準確性。iDISK2.0整合可信來源的數據並進行清理,提升質量。RAG系統結合生物醫學知識圖譜與大型語言模型,能提供準確的證據回應,解決獨立LLMs的錯誤資訊問題。評估結果顯示,準確率達99%和95%,顯著優於獨立LLMs。未來將擴展至其他生物醫學領域,並透過真實查詢增強評估。 PubMed DOI

這項研究開發了DiMB-RE,專注於飲食與微生物組的關聯,旨在增進對健康影響的理解並支持個人化營養。DiMB-RE包含15種實體類型和13種關係類型,共有14,450個實體和4,206個關係,來自165篇文獻。經過微調的自然語言處理模型在實體識別和關係提取上表現良好,F1分數分別為0.800和0.445。研究顯示,結果部分的註釋有助於改善關係提取。DiMB-RE是同類中最大的語料庫,相關資源可在GitHub上找到。 PubMed DOI

這項研究分析了超過80,000篇文獻,深入探討代謝組學領域。作者利用PubMedBERT將摘要轉換為768維的嵌入向量,並透過t-SNE降維,揭示了在化學、植物生物學、藥理學及臨床診斷等領域的聚類現象。結合GPT-4o mini的主題建模,研究分為20個主題,如「植物壓力反應機制」及「COVID-19代謝組學」。時間分析顯示,自2015年後深度學習的應用增加,且對生物標記的重視持續。研究團隊還提供互動式網頁應用,方便探索這些見解,為研究人員和政策制定者提供有價值的框架。 PubMed DOI

這項研究開發了NICRP-Framework,運用先進NLP技術和大型語言模型,分析各類飲食資料來預測大腸直腸癌風險。該框架能有效處理資料不平衡問題,找出關鍵營養因子,預測準確率高達98.4%。這有助於深入了解飲食與癌症的關聯,並推動更精準、個人化的預防策略。 PubMed DOI

研究團隊整合生醫文獻和資料庫,建立阿茲海默症知識圖譜(ADKG),用NLP技術捕捉AD相關基因、藥物等複雜關聯。經ADKG訓練的模型能預測新關聯,並結合UK Biobank資料後,提升AD預測準確度。ADKG有助於加速治療與診斷發現,推動阿茲海默症精準醫療發展。 PubMed DOI

BRAD agent 是一套開源軟體,能把大型語言模型和外部研究工具、資料來源整合,提升生醫研究的透明度和可重現性。它強調資料來源清楚、操作流程可靠,能自動化文獻檢索、biomarker 發現等任務,彈性高,適合多種應用。原始碼和文件都已公開。 PubMed DOI

作者們開發了 FoodSky,一款專為食物領域設計的大型語言模型,結合完整食物知識庫和先進演算法。FoodSky 在專業食物考試中表現優於一般模型,展現出在烹飪和飲食相關任務上的高效能,為食物專業 AI 設下新標準。 PubMed DOI

研究人員用大型語言模型分析超過7萬篇植物生物學摘要,萃取出近500萬個功能性關聯,涵蓋240萬個生物實體,準確率超過85%。這些資料都整理在PlantConnectome資料庫,方便科學家查詢基因網絡、蛋白質互動和壓力反應,快速掌握最新研究。資料庫網址:https://plant.connectome.tools/ PubMed DOI