原始文章

這項研究推出CMedRAGBot中文臨床醫學問答系統,結合RAG和醫學知識圖譜,有效減少LLM幻覺和知識過時問題。系統包含知識圖譜、強化NER模型(用Chinese-RoBERTa+BiGRU+資料增強)及意圖辨識。實測在五種主流LLM和醫學考題上,答案正確率最高提升10%。資料增強和意圖辨識對NER和複雜問題理解特別有幫助。原始碼已開源。 PubMed DOI


站上相關主題文章列表

基於知識圖譜的檢索增強生成(KG-RAG)框架,成功解決了大型語言模型在生物醫學等知識密集型領域的挑戰。透過SPOKE生物醫學知識圖譜,KG-RAG優化了標記使用,提升了Llama-2、GPT-3.5和GPT-4的表現。該框架有效降低標記消耗超過50%,同時保持準確性,顯著改善了對生物醫學提示的回應,並在基準數據集上提升表現,Llama-2在多選題上提高了71%。KG-RAG以具成本效益的方式結合知識圖譜與大型語言模型,讓通用模型更能應對特定領域查詢。SPOKE KG和KG-RAG的代碼已公開,並提供生物醫學基準數據集供研究使用。 PubMed DOI

在醫療領域,先進的大型語言模型(LLMs)逐漸被應用,但在傳統中醫(TCM)方面的專業知識仍然不足。為了解決這個問題,我們開發了TCMChat,這是一個專門針對中醫文本和中文問答數據集訓練的生成性LLM。TCMChat基於Baichuan2-7B-Chat模型,經過預訓練和微調,並在六個中醫相關場景中表現優異。我們的資源已在GitHub和HuggingFace上公開,為中醫研究提供了有價值的工具和友好的對話介面。 PubMed DOI

這項研究強調大型語言模型(LLMs)在醫療領域的潛力,特別是透過檢索增強生成(RAG)來提升數據透明度和準確性。研究團隊開發了GuideGPT,一個能理解上下文的聊天機器人,整合了449篇科學文獻的知識,提供有關藥物相關性顳骨壞死(MRONJ)的資訊。與通用的PureGPT相比,GuideGPT在內容、科學解釋和一致性上表現更佳,顯示RAG能有效提升LLM的回應質量,成為臨床實踐中的重要工具。 PubMed DOI

檢索增強生成(RAG)透過從資料庫中檢索知識來提升大型語言模型(LLMs)的表現,但傳統方法在檢索句子或段落時可能會引入噪音。為了解決這個問題,我們提出了BiomedRAG框架,將自動檢索的區塊文件直接輸入LLM。經過在四個生物醫學自然語言處理任務和八個數據集的評估,BiomedRAG的表現平均提升了9.95%,並且在多項基準上達到最先進的結果,超越了4.97%。這個框架為生物醫學領域的LLM應用提供了更準確且可調整的方法。 PubMed DOI

這項研究旨在利用現代數據技術提升中醫病例記錄的可及性與分析能力。研究分析了679份來自新安醫學王仲期醫師的病例,涵蓋41種疾病,並建立了模式層來整合數據與可視化。透過大型語言模型(LLM),自動識別病例中的關鍵資訊,並建立中醫病例知識圖譜。開發的查詢系統在性能評估中表現優異,顯示結合LLM與知識圖譜能顯著提升中醫資訊檢索的效率與準確性,未來將擴展數據集與精進查詢系統。 PubMed DOI

Thyro-GenAI是一款基於檢索增強生成(RAG)技術的聊天機器人,專注於甲狀腺疾病的臨床問題。經過與其他三款服務型大型語言模型(如ChatGPT、Perplexity和Claude)的比較,Thyro-GenAI在回應質量上表現最佳,並且在參考資料的可靠性上也名列前茅。這顯示出Thyro-GenAI能提供更準確的臨床推理,減少幻覺現象,對一線醫師在管理甲狀腺疾病患者時具有重要的輔助價值。 PubMed DOI

這項研究開發了一套用於提升核醫療診斷治療的聊天機器人架構,透過情境增強(RAG)讓大型語言模型能查找相關研究資料。測試五款主流LLM後發現,RAG能明顯提升答案品質,尤其CLAUDE 3 OPUS和GPT-4O表現最好。研究也提醒,目前問題範圍有限,未來應擴大題目多樣性並比較人類與AI的評分。 PubMed DOI

這項研究比較四種大型語言模型在回答心血管疾病預防問題時的表現。結果發現,ChatGPT-4.0 英文答題最準確且自我覺察,中文則是 ERNIE 表現較好。不過,所有模型在中文表現都稍差,顯示有語言偏差。這提醒我們,AI 醫療建議在不同語言下還需要持續檢驗。 PubMed DOI

作者提出一套專為醫療AI助理設計的兩步驟RAG架構,結合嵌入式搜尋和Elasticsearch,並用專家審查的知識庫。系統採用ColBERTv2提升排序效率,讓複雜醫療問題的準確率比傳統LLM和單一RAG高10%。雖然緊急時反應稍慢,但在準確度和即時性間取得不錯平衡,對醫療應用很有潛力。 PubMed DOI

這項研究用RAG技術強化大型語言模型在醫學問答的表現,不用重新訓練模型。透過加入相關醫學事實,模型準確率明顯提升(像Vicuna-7B在MedQA-SMILE從44.46%進步到48.54%),證明RAG能讓LLM在專業領域更有效率,也更透明。 PubMed