原始文章

本研究探討如何透過檢索增強生成(RAG)提升大型語言模型(LLMs)對臨床指引的遵循性,特別針對加拿大放射學指引中的肝膽系統發現。研究建立自訂RAG架構,測試GPT-4o和o1-mini兩個模型,分析遵循率、可讀性及反應時間。結果顯示,啟用RAG後,GPT-4o遵循率從81.7%提升至97.2%,o1-mini則從79.3%提升至95.1%。RAG模型在可讀性上有所改善,反應時間略長但仍可接受。此方法顯示增強基於證據的護理潛力,值得在臨床中進一步驗證。 PubMed DOI


站上相關主題文章列表

這項研究探討檢索增強生成(RAG)模型在回答擴散性大B細胞淋巴瘤(DLBCL)問題的效果,並與OpenAI的GPT-3.5、GPT-4及微軟的Prometheus進行比較。結果顯示,RAG模型在準確性和相關性上表現優於其他大型語言模型,且幻覺現象較少。雖然GPT-4和GPT-3.5在可讀性上較佳,但仍產生了許多不準確的資訊。研究強調了進一步探索不同模型架構及方法在專業領域的潛力。 PubMed DOI

這項研究探討增強檢索生成(RAG)的大型語言模型(LLMs)在急診科臨床紀錄中生成ICD-10-CM代碼的有效性,並與醫療提供者進行比較。研究基於Mount Sinai Health System的500次急診就診數據,發現RAG增強的LLMs在準確性和特異性上均優於醫療提供者,且GPT-4的表現尤為突出。即使是較小的模型如Llama-3.1-70B,經過RAG後也顯示出顯著提升。這顯示生成式人工智慧在改善醫療編碼準確性及減少行政負擔方面的潛力。 PubMed DOI

在診斷影像中,偶然發現的結果如膽囊息肉常見,但後續建議常不一致。超聲波放射學會(SRU)於2021年制定了相關指導方針,旨在確保適當的後續追蹤並減少不必要的治療。然而,這些指導方針在放射學報告中的遵循程度不一,讓臨床醫師難以提供適當的後續護理。 本研究評估了一種基於大型語言模型(LLM)的工具GB-PRL,旨在將SRU指導方針納入放射學報告。研究顯示,GB-PRL在風險分類和後續建議中達到100%準確率,表現優於傳統報告,但在臨床實踐前仍需進一步測試。 PubMed DOI

這項研究探討了檢索增強生成(RAG)技術如何提升大型語言模型(LLMs)在乳腺癌護理中的效能。研究比較了兩組:一組使用GPT-4模型,另一組則結合RAG技術。結果顯示,RAG-GPT組在整體滿意度(8.4對5.4)和回答準確性(8.6對5.6)上明顯優於對照組,且差異具統計意義(p < 0.01)。不過,兩組在同理心得分上無顯著差異(8.4對7.8,p > 0.05)。結論指出,RAG技術能有效提升LLMs在臨床護理中的表現,顯示其在護理實踐和教育上的潛力。 PubMed DOI

本研究綜合了近期在生物醫學領域中有關檢索增強生成(RAG)和大型語言模型(LLMs)的研究,旨在提供臨床發展的指導方針。透過系統文獻回顧和統合分析,研究納入了335項研究中的20項,結果顯示RAG顯著提升了模型表現,勝算比為1.35(P = .001)。報告詳細說明了臨床任務及評估方法,並提出在臨床環境中實施增強LLM的指導方針。未來研究應聚焦於RAG的整合與應用。 PubMed DOI

本研究探討大型語言模型(LLMs)在從放射科報告中提取額外影像檢查建議(RAIs)的有效性。研究回顧了250份報告,確認231份包含RAIs,並使用自然語言處理算法進行分析。結果顯示,GPT-4在提取RAI檢查方式、身體部位和時間框架方面的準確率均優於GPT-3.5,顯示出LLMs在確保影像檢查建議及時完成的潛力,可能有助於減少診斷延遲。 PubMed DOI

這項研究探討了增強檢索生成(RAG)的GPT-4模型在診斷和分類創傷性傷害的效果。研究人員開發了名為TraumaCB的工具,利用專家知識來提升準確性。結果顯示,TraumaCB在診斷上達到100%準確率,分類96%,明顯優於一般的GPT-4。這項研究強調了傷害分類的挑戰,並指出結合RAG的GPT-4能提升創傷放射學的診斷能力,對急診部門的效率有正面影響。 PubMed DOI

最近大型語言模型(LLMs)如GPT-3.5和GPT-4在醫療領域的應用引起關注。本研究比較了這些模型在註解放射學報告及生成胸部CT印象的表現,旨在協助醫療專業人員處理日常文檔任務。研究使用了上下文學習和檢索增強生成等方法,並透過多種指標進行評估。結果顯示,GPT-4在性能上優於GPT-3.5,且提示設計對結果影響顯著。研究建議在醫療實踐中整合這些先進模型,以提升文檔效率與準確性。 PubMed DOI

這項研究探討大型語言模型(LLMs)和檢索增強生成(RAG)系統在管理基於證據的信息的效果,特別針對13項神經學指導方針和130個問題。結果顯示性能差異明顯,雖然RAG系統在準確性上有所提升,但仍可能產生有害回應。此外,RAG系統在處理案例型問題時表現不如知識型問題。研究強調需要進一步改進和規範,以確保RAG增強的LLMs在臨床上的安全使用。 PubMed DOI

這篇文章探討了一項研究,分析檢索增強生成(RAG)如何提升大型語言模型(LLMs)在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫,無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫,並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示,RAG 顯著提升了 GPT-4 和 Command R+ 的得分,特別是在與 *RadioGraphics* 相關的問題上,成功檢索並引用了相關資料。整體而言,RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI