The Emerging Role of Large Language Models in Improving Prostate Cancer Literacy.
大型語言模型在提升前列腺癌知識中的新興角色。 Bioengineering (Basel) 2024-07-27

這項研究評估了大型語言模型（LLMs）驅動的聊天機器人，如ChatGPT 3.5、CoPilot和Gemini，在提供前列腺癌資訊的有效性，並與官方病人指南進行比較。研究使用25個專家驗證的問題，根據準確性、及時性、完整性和可理解性進行評估。結果顯示，ChatGPT 3.5的表現優於其他模型，證明其為可靠的資訊來源。研究強調在健康領域持續創新AI應用的重要性，並建議未來探討AI回應中的潛在偏見及其對病人結果的影響。 PubMed DOI

Evaluation of a context-aware chatbot using retrieval-augmented generation for answering clinical questions on medication-related osteonecrosis of the jaw.
使用檢索增強生成技術評估上下文感知聊天機器人，以回答有關藥物相關性下顎骨壞死的臨床問題。 J Craniomaxillofac Surg 2025-01-11

這項研究強調大型語言模型（LLMs）在醫療領域的潛力，特別是透過檢索增強生成（RAG）來提升數據透明度和準確性。研究團隊開發了GuideGPT，一個能理解上下文的聊天機器人，整合了449篇科學文獻的知識，提供有關藥物相關性顳骨壞死（MRONJ）的資訊。與通用的PureGPT相比，GuideGPT在內容、科學解釋和一致性上表現更佳，顯示RAG能有效提升LLM的回應質量，成為臨床實踐中的重要工具。 PubMed DOI

Retrieval-Augmented Generation: Advancing personalized care and research in oncology.
檢索增強生成：推進腫瘤學中的個人化護理與研究。 Eur J Cancer 2025-03-11

檢索增強生成（RAG）透過整合最新數據，提升大型語言模型（LLMs）的準確性與上下文意識。這方法將文本轉為數值嵌入，幫助檢索與使用者查詢相關的數據片段，讓模型的回答更具時效性。在腫瘤學中，RAG能改善治療建議、增強臨床試驗匹配，並加速藥物開發。不過，RAG的效果取決於數據質量，偏見或不完整的信息可能導致錯誤結果，因此需謹慎實施並加強人類監督。 PubMed DOI

Enhancing Large Language Models with Retrieval-augmented Generation: A Radiology-specific Approach.
強化大型語言模型的檢索增強生成：一種放射科特定的方法。 Radiol Artif Intell 2025-03-12

這篇文章探討了一項研究，分析檢索增強生成（RAG）如何提升大型語言模型（LLMs）在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫，無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫，並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示，RAG 顯著提升了 GPT-4 和 Command R+ 的得分，特別是在與 *RadioGraphics* 相關的問題上，成功檢索並引用了相關資料。整體而言，RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI

[Integration of large language models into the clinic : Revolution in analysing and processing patient data to increase efficiency and quality in radiology].
大型語言模型在臨床中的整合：革命性地分析和處理患者數據，以提高放射學的效率和質量。 Radiologie (Heidelb) 2025-03-12

大型語言模型（LLMs）如ChatGPT、Llama和Claude，正在改變醫療保健，特別是在放射科。最近，弗賴堡和巴塞爾大學醫院的研究顯示，這些系統能有效整合影像存檔與傳輸系統（PACS）和電子健康紀錄（EHR），提升醫師效率，縮短報告時間，並自動化例行任務。研究結果顯示，LLMs不僅提高了診斷質量，還促進了跨學科合作。未來應著重增強透明度和擴大應用範圍，確保遵守倫理和法律標準。 PubMed DOI

Thyro-GenAI: A Chatbot Using Retrieval-Augmented Generative Models for Personalized Thyroid Disease Management.
Thyro-GenAI：一個使用檢索增強生成模型的聊天機器人，用於個性化甲狀腺疾病管理。 J Clin Med 2025-04-12

Thyro-GenAI是一款基於檢索增強生成（RAG）技術的聊天機器人，專注於甲狀腺疾病的臨床問題。經過與其他三款服務型大型語言模型（如ChatGPT、Perplexity和Claude）的比較，Thyro-GenAI在回應質量上表現最佳，並且在參考資料的可靠性上也名列前茅。這顯示出Thyro-GenAI能提供更準確的臨床推理，減少幻覺現象，對一線醫師在管理甲狀腺疾病患者時具有重要的輔助價值。 PubMed DOI

Precision Oncology in Non-small Cell Lung Cancer: A Comparative Study of Contextualized ChatGPT Models.
非小細胞肺癌精準腫瘤醫學：情境化 ChatGPT 模型的比較研究 Cureus 2025-04-24

這項研究發現，讓 ChatGPT 直接讀取 NCCN 指南 PDF 並搭配提示語（PDF+Prompt），能大幅提升其在建議晚期非小細胞肺癌治療時的準確度和符合指引性，且回覆更清楚易懂。單靠提示語沒有效果。這表示，若大型語言模型能直接存取臨床指引，對腫瘤治療決策會更有幫助，但還需更多研究來驗證其他癌症和臨床情境的適用性。 PubMed DOI

Comparison of Large Language Models' Performance on 600 Nuclear Medicine Technology Board Examination-Style Questions.
大型語言模型在600題核醫技術師國家考試題型上的表現比較 J Nucl Med Technol 2025-05-09

這項研究比較多款大型語言模型（LLM）在核子醫學題目的表現，發現結合檢索增強生成（RAG）的 GPT-4o 準確率最高。RAG 整體有助提升答題表現。雖然 LLM 在教育和臨床輔助有潛力，但對複雜指引和影像題還不夠理想，未來還需再優化才能安心用於醫療領域。 PubMed DOI

CMedRAGBot: A Chinese Medical Chatbot Based on Graph RAG and Large Language Models.
CMedRAGBot：基於圖譜RAG與大型語言模型的中文醫療聊天機器人 Interdiscip Sci 2025-06-05

這項研究推出CMedRAGBot中文臨床醫學問答系統，結合RAG和醫學知識圖譜，有效減少LLM幻覺和知識過時問題。系統包含知識圖譜、強化NER模型（用Chinese-RoBERTa+BiGRU+資料增強）及意圖辨識。實測在五種主流LLM和醫學考題上，答案正確率最高提升10%。資料增強和意圖辨識對NER和複雜問題理解特別有幫助。原始碼已開源。 PubMed DOI

Answering real-world clinical questions using large language model, retrieval-augmented generation, and agentic systems.
運用大型語言模型、檢索增強生成與代理系統來解答真實世界臨床問題 Digit Health 2025-06-13

像 ChatGPT-4 這類通用型 LLM，回答臨床問題時常缺乏實用或有根據的建議。反觀專門設計的 OpenEvidence 和 ChatRWD，表現明顯更好。OpenEvidence 在有文獻時特別強，ChatRWD 則能在沒研究時給出可行建議。兩者結合，有望大幅提升臨床決策的循證支持。 PubMed DOI

原始文章

站上相關主題文章列表