Preliminary assessment of automated radiology report generation with generative pre-trained transformers: comparing results to radiologist-generated reports.
利用生成式預訓練轉換器進行自動放射學報告生成的初步評估：與放射科醫師生成的報告進行比較。 Jpn J Radiol 2024-02-06

研究比較了GPT模型和放射科醫師生成放射學報告的表現，結果顯示GPT-4在準確性上優於GPT-2和GPT-3.5，但仍不及醫師。醫師在印象和鑑別診斷方面表現較佳。GPT-3.5和GPT-4生成的報告可讀性高，但準確性仍需醫師驗證。 PubMed DOI

A retrieval-augmented chatbot based on GPT-4 provides appropriate differential diagnosis in gastrointestinal radiology: a proof of concept study.
基於 GPT-4 的檢索增強型聊天機器人在胃腸放射學中提供適當的不同診斷：概念驗證研究。 Eur Radiol Exp 2024-05-16

研究使用GPT-4智能對話機器人，結合腸胃影像知識，能準確診斷腹部病變。相較一般對話機器人，它在診斷和解釋上更優秀，並可查閱來源文件。整合特定背景資料到AI模型可支持臨床決策，為可靠的AI輔助決策系統鋪平道路。 PubMed DOI

Emergency Patient Triage Improvement through a Retrieval-Augmented Generation Enhanced Large-Scale Language Model.
透過檢索增強生成增強大規模語言模型，改善急診病人分類。 Prehosp Emerg Care 2024-07-01

研究目的是評估使用RAG和LLMs（如GPT模型）來改善急診分流流程，提升護理一致性。通過模擬情境測試，發現搭配RAG的GPT-3.5模型在分流準確性上表現優異，可達70%正確率，並將低分流率降至8%。整合這兩者可提高急診評估的精確性和一致性，但仍需在實際醫療環境中驗證。 PubMed DOI

Comparative analysis of GPT-4-based ChatGPT's diagnostic performance with radiologists using real-world radiology reports of brain tumors.
基於 GPT-4 的 ChatGPT 與放射科醫生在腦腫瘤實際放射學報告中的診斷表現比較分析。 Eur Radiol 2024-08-28

這項研究評估了GPT-4（特別是ChatGPT）在解讀腦腫瘤MRI報告的診斷能力。研究分析了150份術前病患的報告，結果顯示GPT-4的診斷準確率為73%，而神經放射科醫師則為80%。在鑑別診斷方面，GPT-4的準確率高達94%，放射科醫師則介於73%到89%之間。研究結果表明，GPT-4可作為神經放射科醫師的有用第二意見，並能成為一般放射科醫師和住院醫師的指導工具，顯示其在臨床診斷中的潛力。 PubMed DOI

Enhancing chatbot performance for imaging recommendations: Leveraging GPT-4 and context-awareness for trustworthy clinical guidance.
提升聊天機器人在影像建議中的表現：利用 GPT-4 和情境意識提供可靠的臨床指導。 Eur J Radiol 2024-09-26

這項研究探討了一個上下文感知的聊天機器人，旨在根據美國放射學會的標準提供個性化影像建議。透過從GPT-3.5-Turbo升級到GPT-4，並運用最新技術，這個聊天機器人在建議的準確性和一致性上顯著優於舊版及一般放射科醫生。研究結果顯示，該機器人在「通常適當」的建議中達到78%一致性，並在「通常或可能適當」中達到94%。這強調了上下文感知和透明度在增強信任方面的重要性，對臨床決策支持有正面影響。 PubMed DOI

Testing the Ability and Limitations of ChatGPT to Generate Differential Diagnoses from Transcribed Radiologic Findings.
測試 ChatGPT 生成放射學發現的鑑別診斷能力與限制。 Radiology 2024-10-15

這項研究評估了ChatGPT（GPT-3.5和GPT-4）在根據放射學轉錄生成鑑別診斷的表現。分析了339個案例，結果顯示GPT-4的準確性較高，正確診斷比例為66.1%，而GPT-3.5為53.7%。雖然GPT-4在準確性和虛構參考文獻方面表現較佳，但兩者在重複性上仍有問題。總體來看，ChatGPT在醫學上可作為有用工具，但使用時需謹慎以避免不準確性。 PubMed DOI

Enhancing Large Language Models with Retrieval-augmented Generation: A Radiology-specific Approach.
強化大型語言模型的檢索增強生成：一種放射科特定的方法。 Radiol Artif Intell 2025-03-12

這篇文章探討了一項研究，分析檢索增強生成（RAG）如何提升大型語言模型（LLMs）在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫，無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫，並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示，RAG 顯著提升了 GPT-4 和 Command R+ 的得分，特別是在與 *RadioGraphics* 相關的問題上，成功檢索並引用了相關資料。整體而言，RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI

Evaluation of a Retrieval-Augmented Generation-Powered Chatbot for Pre-CT Informed Consent: a Prospective Comparative Study.
基於檢索增強生成技術的聊天機器人在CT前知情同意中的評估：一項前瞻性比較研究。 J Imaging Inform Med 2025-03-22

這項研究評估了一個基於檢索增強生成（RAG）技術的病人資訊助手（PIA）聊天機器人在提供CT前資訊的可行性與有效性，並與傳統醫生諮詢比較。研究對象為86名預定接受CT的病人，隨機分為PIA組和對照組。主要發現包括：兩組在資訊清晰度和理解度上相似，但對照組在減輕病人擔憂方面更有效。PIA組的諮詢時間顯著較短。放射科醫生對PIA的評價也很高。總結來說，PIA有效提供CT前資訊並縮短諮詢時間，但醫生在解決病人擔憂方面表現更佳。 PubMed DOI

Retrieval-augmented generation enhances large language model performance on the Japanese orthopedic board examination.
檢索增強生成提升大型語言模型在日本骨科考試中的表現。 J Orthop Sci 2025-03-29

這項研究探討檢索增強生成（RAG）對大型語言模型（LLMs）在醫學領域的影響，特別針對2024年日本骨科專家考試。研究團隊建立了專門資料庫，評估了GPT-3.5 Turbo、GPT-4o和o1-preview的表現。結果顯示，GPT-3.5 Turbo使用RAG後準確率未見提升，仍為28%；而GPT-4o和o1-preview的準確率分別從62%和67%提升至72%和84%。分析指出，GPT-3.5 Turbo在利用檢索數據上表現不佳，顯示其推理能力不足。總體而言，RAG顯著提升了GPT-4o和o1-preview的表現，特別是o1-preview達到臨床實踐的水準。 PubMed DOI

Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness.
10 種大型語言模型的檢索增強生成及其在評估醫療適應性中的普遍性。 NPJ Digit Med 2025-04-04

這項研究探討了基於GPT-4的檢索增強生成（RAG）模型在術前評估中的有效性。研究測試了十個大型語言模型，生成超過3,200個回應，並與近450個人類答案進行比較。結果顯示，使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%，明顯高於人類的86.6%，且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

原始文章

站上相關主題文章列表