原始文章

這項研究開發了一套用於提升核醫療診斷治療的聊天機器人架構,透過情境增強(RAG)讓大型語言模型能查找相關研究資料。測試五款主流LLM後發現,RAG能明顯提升答案品質,尤其CLAUDE 3 OPUS和GPT-4O表現最好。研究也提醒,目前問題範圍有限,未來應擴大題目多樣性並比較人類與AI的評分。 PubMed DOI


站上相關主題文章列表

這項研究評估了大型語言模型(LLMs)驅動的聊天機器人,如ChatGPT 3.5、CoPilot和Gemini,在提供前列腺癌資訊的有效性,並與官方病人指南進行比較。研究使用25個專家驗證的問題,根據準確性、及時性、完整性和可理解性進行評估。結果顯示,ChatGPT 3.5的表現優於其他模型,證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性,並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

近年來,大型語言模型(LLMs)已被應用於醫療領域,特別是在前列腺癌的病患溝通上。我們的研究評估了三種LLM的效果,包括ChatGPT(3.5)、Gemini(Pro)和Co-Pilot(免費版),並與官方的羅馬尼亞前列腺癌病患指南進行比較。透過隨機和盲測,八位醫療專業人員根據準確性、及時性、全面性和使用友好性進行評估。結果顯示,LLM,尤其是ChatGPT,通常提供比指南更準確且友好的資訊,顯示出其在改善醫療溝通上的潛力。不過,不同模型的表現差異也顯示出需要量身定制的實施策略。 PubMed DOI

這項研究探討檢索增強生成(RAG)模型在回答擴散性大B細胞淋巴瘤(DLBCL)問題的效果,並與OpenAI的GPT-3.5、GPT-4及微軟的Prometheus進行比較。結果顯示,RAG模型在準確性和相關性上表現優於其他大型語言模型,且幻覺現象較少。雖然GPT-4和GPT-3.5在可讀性上較佳,但仍產生了許多不準確的資訊。研究強調了進一步探索不同模型架構及方法在專業領域的潛力。 PubMed DOI

這篇論文探討大型語言模型(LLMs)的進展,特別是在醫療領域的應用,像是開發專注於臨床準確性的醫療聊天機器人和虛擬助手。文中介紹了一個新型的多輪對話模型,具備以下創新特點: 1. **層正規化調整**:改善訓練的穩定性。 2. **上下文滑動窗口回覆預測**:更好地捕捉對話上下文。 3. **局部關鍵信息提煉**:提升回覆質量。 該模型在MIMIC-III和n2c2數據集上測試,顯示出顯著的改進,能有效支持患者和醫療提供者。 PubMed DOI

這項研究強調大型語言模型(LLMs)在醫療領域的潛力,特別是透過檢索增強生成(RAG)來提升數據透明度和準確性。研究團隊開發了GuideGPT,一個能理解上下文的聊天機器人,整合了449篇科學文獻的知識,提供有關藥物相關性顳骨壞死(MRONJ)的資訊。與通用的PureGPT相比,GuideGPT在內容、科學解釋和一致性上表現更佳,顯示RAG能有效提升LLM的回應質量,成為臨床實踐中的重要工具。 PubMed DOI

這篇文章探討了一項研究,分析檢索增強生成(RAG)如何提升大型語言模型(LLMs)在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫,無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫,並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示,RAG 顯著提升了 GPT-4 和 Command R+ 的得分,特別是在與 *RadioGraphics* 相關的問題上,成功檢索並引用了相關資料。整體而言,RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI

Thyro-GenAI是一款基於檢索增強生成(RAG)技術的聊天機器人,專注於甲狀腺疾病的臨床問題。經過與其他三款服務型大型語言模型(如ChatGPT、Perplexity和Claude)的比較,Thyro-GenAI在回應質量上表現最佳,並且在參考資料的可靠性上也名列前茅。這顯示出Thyro-GenAI能提供更準確的臨床推理,減少幻覺現象,對一線醫師在管理甲狀腺疾病患者時具有重要的輔助價值。 PubMed DOI

這項研究發現,讓 ChatGPT 直接讀取 NCCN 指南 PDF 並搭配提示語(PDF+Prompt),能大幅提升其在建議晚期非小細胞肺癌治療時的準確度和符合指引性,且回覆更清楚易懂。單靠提示語沒有效果。這表示,若大型語言模型能直接存取臨床指引,對腫瘤治療決策會更有幫助,但還需更多研究來驗證其他癌症和臨床情境的適用性。 PubMed DOI

這項研究比較多款大型語言模型(LLM)在核子醫學題目的表現,發現結合檢索增強生成(RAG)的 GPT-4o 準確率最高。RAG 整體有助提升答題表現。雖然 LLM 在教育和臨床輔助有潛力,但對複雜指引和影像題還不夠理想,未來還需再優化才能安心用於醫療領域。 PubMed DOI

這項研究推出CMedRAGBot中文臨床醫學問答系統,結合RAG和醫學知識圖譜,有效減少LLM幻覺和知識過時問題。系統包含知識圖譜、強化NER模型(用Chinese-RoBERTa+BiGRU+資料增強)及意圖辨識。實測在五種主流LLM和醫學考題上,答案正確率最高提升10%。資料增強和意圖辨識對NER和複雜問題理解特別有幫助。原始碼已開源。 PubMed DOI