基於知識圖譜的檢索增強生成(KG-RAG)框架,成功解決了大型語言模型在生物醫學等知識密集型領域的挑戰。透過SPOKE生物醫學知識圖譜,KG-RAG優化了標記使用,提升了Llama-2、GPT-3.5和GPT-4的表現。該框架有效降低標記消耗超過50%,同時保持準確性,顯著改善了對生物醫學提示的回應,並在基準數據集上提升表現,Llama-2在多選題上提高了71%。KG-RAG以具成本效益的方式結合知識圖譜與大型語言模型,讓通用模型更能應對特定領域查詢。SPOKE KG和KG-RAG的代碼已公開,並提供生物醫學基準數據集供研究使用。
PubMed
DOI