Evaluating LLMs for Diagnosis Summarization.
評估大型語言模型在診斷摘要中的應用。 Annu Int Conf IEEE Eng Med Biol Soc 2025-03-05

這篇論文探討了六種大型語言模型（LLMs）在自動化出院摘要方面的有效性，並提出了一種新的自動評估指標，與人類評估結果相符。研究使用F1-Score來評估模型表現，並與醫療專業人員的評估進行比較。結果顯示，雖然LLMs有潛力，但在醫學知識和診斷能力上仍需改進。實驗的源代碼和數據可在GitHub上找到。 PubMed DOI

Critical care studies using large language models based on electronic healthcare records: A technical note.
基於電子健康紀錄應用大型語言模型於重症醫學研究之技術說明 J Intensive Med 2025-04-17

這份技術說明介紹大型語言模型（如 GPT-4、Qwen-Chat）如何分析電子病歷，協助快速評估病患、預測敗血症及自動產生加護病房出院摘要。內容也說明如何用 DashScope API 把 LLMs 整合進臨床流程，並提供實用指引，幫助醫師和研究人員提升照護品質與推動個人化醫療。 PubMed DOI

Use of Open-Source Large Language Models for Automatic Synthesis of the Entire Imaging Medical Records of Patients: A Feasibility Study.
開源大型語言模型於自動整合病患完整影像醫療紀錄之應用：可行性研究 Tomography 2025-04-25

這項研究用三種開源AI模型自動摘要病人影像檢查紀錄，經專業醫師評估，發現AI摘要內容準確、實用又好上手。這樣能幫醫師快速掌握重點，省下查閱時間，資訊品質也沒打折，對放射科工作流程很有幫助。 PubMed DOI

Automating Evaluation of AI Text Generation in Healthcare with a Large Language Model (LLM)-as-a-Judge.
以大型語言模型（LLM）作為評審自動化評估醫療領域 AI 文字生成 medRxiv 2025-05-02

本研究提出用大型語言模型（LLM）自動評估AI生成的電子健康紀錄（EHR）摘要，效果和專家評分高度一致，尤其是像GPT-3這類模型。這種方法省時又可靠，有助於確保醫療AI摘要的品質與安全性，適合大規模應用。 PubMed DOI

Physician- and Large Language Model-Generated Hospital Discharge Summaries.
醫師與大型語言模型生成的出院摘要 JAMA Intern Med 2025-05-05

研究發現，大型語言模型（LLM）生成的出院摘要，品質和醫師寫的差不多，受歡迎程度也相近。LLM寫的內容比較精簡、結構清楚，但資訊沒那麼完整，錯誤率也稍高。不過這些錯誤通常不會造成傷害。只要有醫師審核，LLM生成的摘要很有機會成為醫院的好幫手。 PubMed DOI

Automated generation of discharge summaries: leveraging large language models with clinical data.
自動生成出院摘要：結合臨床資料與大型語言模型 Sci Rep 2025-05-12

這項研究用開源大型語言模型（像LLaMA3）自動產生德文出院摘要，並請醫師評估品質。結果顯示，AI生成的摘要資訊算完整，但常漏掉重要細節或出現錯誤，尤其在複雜病例時更明顯。研究也發現資料集太小、資料不全和模型德文醫學詞彙不足是主要挑戰，建議未來要用更多資料和微調模型，才能提升表現。 PubMed DOI

Scientific Evidence for Clinical Text Summarization Using Large Language Models: Scoping Review.
使用大型語言模型進行臨床文本摘要的科學實證：範疇性回顧 J Med Internet Res 2025-05-15

這篇回顧分析30篇用大型語言模型做臨床文本摘要的研究，發現多集中在美國加護病房的英文放射科報告，且常用同一資料集。大多數採抽象式摘要和開源模型，但方法和評估標準不一，外部驗證和安全性分析很少。整體來說，目前研究還在初步階段，實際臨床應用有限，未來需加強評估和重視臨床實用性。 PubMed DOI

LLMonFHIR: A Physician-Validated, Large Language Model-Based Mobile Application for Querying Patient Electronic Health Data.
LLMonFHIR：經醫師驗證、基於大型語言模型的行動應用程式，用於查詢病患電子健康資料 JACC Adv 2025-05-15

這項研究推出 LLMonFHIR 行動 App，運用大型語言模型，幫助慢性心血管病人用多種語言、不同難度，甚至語音方式，查詢自己的電子健康紀錄。初步測試顯示，醫師認為 App 回覆正確、好懂又實用。雖然在健康摘要和檢驗數據查詢上還有改進空間，但 LLMonFHIR 有助於解決語言和健康素養障礙，讓病人更容易掌握自己的健康資訊。 PubMed DOI

Assessment and Integration of Large Language Models for Automated Electronic Health Record Documentation in Emergency Medical Services.
大型語言模型於緊急醫療服務自動化電子病歷紀錄之評估與整合 J Med Syst 2025-05-17

這項研究用多個大型語言模型（像是GPT-4、Claude 3.5等）來自動化產生EMS對話的電子病歷，結果比單一模型更準確，F1分數最高到0.81。專家也認為這系統能減輕紀錄負擔，但偶爾還是會誤解醫療情境。這是首次針對急診醫療紀錄自動化做系統性評估，展現未來應用潛力。 PubMed DOI

Large language model discharge summary preparation using real-world electronic medical record data shows promise.
使用真實世界電子病歷資料進行大型語言模型出院摘要撰寫展現潛力 Intern Med J 2025-05-28

**重點摘要：** 這項研究測試了兩個大型語言模型（LLMs），用來從真實的臨床紀錄自動產生出院摘要，並用一個經過驗證的評分指標來評分他們的結果。兩個模型的表現差不多，顯示LLMs有潛力協助醫師準備出院摘要，進而減輕臨床醫師的行政工作負擔。 PubMed DOI

原始文章

站上相關主題文章列表