Emergency Patient Triage Improvement through a Retrieval-Augmented Generation Enhanced Large-Scale Language Model.
透過檢索增強生成增強大規模語言模型，改善急診病人分類。 Prehosp Emerg Care 2024-07-01

研究目的是評估使用RAG和LLMs（如GPT模型）來改善急診分流流程，提升護理一致性。通過模擬情境測試，發現搭配RAG的GPT-3.5模型在分流準確性上表現優異，可達70%正確率，並將低分流率降至8%。整合這兩者可提高急診評估的精確性和一致性，但仍需在實際醫療環境中驗證。 PubMed DOI

Can GPT-3.5 generate and code discharge summaries?
Yes, GPT-3.5 can assist in generating and coding discharge summaries. It can help create a structured summary based on the information provided, including patient details, diagnosis, treatment received, and follow-up instructions. However, it's important to note that while GPT-3.5 can generate text based on prompts, it should not be used as a substitute for professional medical judgment or documentation practices. Always ensure that any generated content is reviewed and validated by qualified healthcare professionals. J Am Med Inform Assoc 2024-09-13

這項研究探討使用 GPT-3.5 生成醫療文件並附上 ICD-10 代碼，以增強低資源標籤數據。研究人員從 MIMIC-IV 數據集中生成了 9,606 份出院摘要，專注於不常見的代碼，並將這些數據與基線訓練集結合，創建增強數據集來訓練神經編碼模型。結果顯示，雖然數據增強略微降低整體模型表現，但對生成代碼的表現有所提升。儘管 GPT-3.5 能識別 ICD-10 代碼，但在處理真實數據時仍面臨挑戰，生成文件在多樣性和深度上需改進。 PubMed DOI

Benchmarking Large Language Models for Extraction of International Classification of Diseases Codes from Clinical Documentation.
從臨床文檔中提取國際疾病分類代碼的大型語言模型基準測試。 medRxiv 2024-11-28

這項研究評估大型語言模型（LLMs）在從非結構化住院病歷中提取ICD-10-CM代碼的效果，並與人類編碼員進行比較。測試的模型包括GPT-3.5、GPT-4等，共分析50份去識別化的病歷。人類編碼員識別出165個獨特代碼，平均每份病歷4個。雖然LLMs的中位數代碼數量較高，GPT-4表現最佳，但與人類編碼員的符合率仍然較低，顯示目前LLMs在準確提取ICD-10-CM代碼上仍有挑戰。 PubMed DOI

Extracting International Classification of Diseases Codes from Clinical Documentation using Large Language Models.
使用大型語言模型從臨床文檔中提取國際疾病分類代碼。 Appl Clin Inform 2024-11-28

這項研究評估了六種大型語言模型（LLMs）在從病人筆記中提取ICD-10-CM代碼的表現，並與人類編碼員進行比較。結果顯示，人類編碼員提取了165個代碼，而LLMs提取的數量明顯更多，Llama 2-70b以658個代碼領先。GPT-4與人類的協議百分比最高，但整體協議程度極低。Claude 3在主要診斷方面表現最佳。研究指出，LLMs在提取過程中存在不一致，整體表現仍不及人類編碼員。 PubMed DOI

Using Large Language Models for Efficient Cancer Registry Coding in the Real Hospital Setting: A Feasibility Study.
在實際醫院環境中使用大型語言模型進行高效癌症登記編碼：可行性研究。 Pac Symp Biocomput 2024-12-13

癌症案例報告的主要挑戰在於手動審查大量報告的繁瑣過程。目前的做法多依賴基於規則的系統或自訂的監督學習模型來預測診斷代碼。雖然這些方法有潛力，但在實際應用中可能受到偏見影響。我們針對肺癌進行的可行性研究中，開發了一個檢索增強生成（RAG）系統，利用大型語言模型（LLMs）進行癌症登記編碼。結果顯示，未微調的LLMs也能有效運作，且透過提示工程可顯著提升表現，為癌症登記員提供了提高效率與準確性的有力工具。 PubMed DOI

The Transformative Potential of Large Language Models in Mining Electronic Health Records Data: Content Analysis.
大型語言模型在挖掘電子健康紀錄數據中的變革潛力：內容分析。 JMIR Med Inform 2025-01-02

這項研究評估了大型語言模型（LLMs），特別是GPT-3.5和GPT-4，在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告，結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生，達到96.8%。雖然醫生在精確度上稍勝一籌，但GPT-4的表現更一致，且能推斷出非明確的共病情況。整體而言，這些模型在提取資訊方面顯示出潛力，可能成為數據挖掘的重要工具。 PubMed DOI

Large language models vs human for classifying clinical documents.
大型語言模型與人類在臨床文件分類中的比較。 Int J Med Inform 2025-01-23

這項研究探討了使用先進的大型語言模型，如ChatGPT 3.5和ChatGPT 4，來提升醫療紀錄中ICD-10代碼的分類準確性，特別是針對現有方法識別為假陰性的紀錄。研究在MIMIC IV數據集的802份出院摘要上進行，結果顯示ChatGPT 4的匹配率為86%到89%，明顯優於ChatGPT 3.5的57%到67%。雖然經驗豐富的人類編碼員表現更佳，但ChatGPT 4的準確性已達到人類編碼員的中位數。這顯示將這類模型整合進臨床編碼中，能提升醫療文檔的準確性，特別在複雜案例中。 PubMed DOI

Enhancing Large Language Models with Retrieval-augmented Generation: A Radiology-specific Approach.
強化大型語言模型的檢索增強生成：一種放射科特定的方法。 Radiol Artif Intell 2025-03-12

這篇文章探討了一項研究，分析檢索增強生成（RAG）如何提升大型語言模型（LLMs）在放射學的表現。RAG 讓 LLMs 能夠即時訪問更新的知識庫，無需微調即可生成準確答案。研究中使用了來自 *RadioGraphics* 的 3,689 篇文章作為數據庫，並評估了五種 LLMs 在192道放射學考題中的表現。結果顯示，RAG 顯著提升了 GPT-4 和 Command R+ 的得分，特別是在與 *RadioGraphics* 相關的問題上，成功檢索並引用了相關資料。整體而言，RAG 在放射學任務中展現了提升 LLM 能力的潛力。 PubMed DOI

Retrieval augmented generation for 10 large language models and its generalizability in assessing medical fitness.
10 種大型語言模型的檢索增強生成及其在評估醫療適應性中的普遍性。 NPJ Digit Med 2025-04-04

這項研究探討了基於GPT-4的檢索增強生成（RAG）模型在術前評估中的有效性。研究測試了十個大型語言模型，生成超過3,200個回應，並與近450個人類答案進行比較。結果顯示，使用國際指導的GPT-4 LLM-RAG模型準確率達96.4%，明顯高於人類的86.6%，且反應時間更快、不一致情況較少。這顯示LLM-RAG模型在醫療環境中提升術前評估的潛力。 PubMed DOI

Evaluating large language model workflows in clinical decision support for triage and referral and diagnosis.
臨床決策支援中大型語言模型於分診、轉診與診斷流程的評估 NPJ Digit Med 2025-05-09

**重點摘要：** 這項研究評估了多個大型語言模型（LLMs）以及一個檢索增強生成（RAG）流程，並以2,000個醫療案例作為測試。結果顯示，LLMs能夠協助病人和臨床醫師，像是提供可能的診斷、建議合適的專科醫師，以及評估緊急程度，有機會提升醫療決策品質和醫療服務的效率。 PubMed DOI

原始文章

站上相關主題文章列表