Evaluating LLMs for Diagnosis Summarization.
評估大型語言模型在診斷摘要中的應用。 Annu Int Conf IEEE Eng Med Biol Soc 2025-03-05

這篇論文探討了六種大型語言模型（LLMs）在自動化出院摘要方面的有效性，並提出了一種新的自動評估指標，與人類評估結果相符。研究使用F1-Score來評估模型表現，並與醫療專業人員的評估進行比較。結果顯示，雖然LLMs有潛力，但在醫學知識和診斷能力上仍需改進。實驗的源代碼和數據可在GitHub上找到。 PubMed DOI

[Integration of large language models into the clinic : Revolution in analysing and processing patient data to increase efficiency and quality in radiology].
大型語言模型在臨床中的整合：革命性地分析和處理患者數據，以提高放射學的效率和質量。 Radiologie (Heidelb) 2025-03-12

大型語言模型（LLMs）如ChatGPT、Llama和Claude，正在改變醫療保健，特別是在放射科。最近，弗賴堡和巴塞爾大學醫院的研究顯示，這些系統能有效整合影像存檔與傳輸系統（PACS）和電子健康紀錄（EHR），提升醫師效率，縮短報告時間，並自動化例行任務。研究結果顯示，LLMs不僅提高了診斷質量，還促進了跨學科合作。未來應著重增強透明度和擴大應用範圍，確保遵守倫理和法律標準。 PubMed DOI

Use of Open-Source Large Language Models for Automatic Synthesis of the Entire Imaging Medical Records of Patients: A Feasibility Study.
開源大型語言模型於自動整合病患完整影像醫療紀錄之應用：可行性研究 Tomography 2025-04-25

這項研究用三種開源AI模型自動摘要病人影像檢查紀錄，經專業醫師評估，發現AI摘要內容準確、實用又好上手。這樣能幫醫師快速掌握重點，省下查閱時間，資訊品質也沒打折，對放射科工作流程很有幫助。 PubMed DOI

Automating Evaluation of AI Text Generation in Healthcare with a Large Language Model (LLM)-as-a-Judge.
以大型語言模型（LLM）作為評審自動化評估醫療領域 AI 文字生成 medRxiv 2025-05-02

本研究提出用大型語言模型（LLM）自動評估AI生成的電子健康紀錄（EHR）摘要，效果和專家評分高度一致，尤其是像GPT-3這類模型。這種方法省時又可靠，有助於確保醫療AI摘要的品質與安全性，適合大規模應用。 PubMed DOI

Physician- and Large Language Model-Generated Hospital Discharge Summaries.
醫師與大型語言模型生成的出院摘要 JAMA Intern Med 2025-05-05

研究發現，大型語言模型（LLM）生成的出院摘要，品質和醫師寫的差不多，受歡迎程度也相近。LLM寫的內容比較精簡、結構清楚，但資訊沒那麼完整，錯誤率也稍高。不過這些錯誤通常不會造成傷害。只要有醫師審核，LLM生成的摘要很有機會成為醫院的好幫手。 PubMed DOI

Evaluating large language models in echocardiography reporting: opportunities and challenges.
在心臟超音波報告中評估大型語言模型：機會與挑戰 Eur Heart J Digit Health 2025-05-21

研究團隊用開源大型語言模型微調，讓它們能自動整理心臟超音波報告。其中 EchoGPT（基於 Llama-2）表現最好，產出的總結精簡度幾乎和心臟科醫師寫的一樣好。這技術有望加快報告產出速度又不影響品質，但目前評估 AI 報告的方法還需要改進。 PubMed DOI

Optimizing Large Language Models for Discharge Prediction: Best Practices in Leveraging Electronic Health Record Audit Logs.
最佳化大型語言模型於出院預測：運用電子病歷稽核紀錄的最佳實務 AMIA Annu Symp Proc 2025-05-26

這項研究發現，經過微調的 LLaMA-2 70B 模型，能有效運用電子病歷稽核紀錄來預測病人出院時間，表現比 GPT-4 和 DeBERTa 更好。採用「首次出現」事件序列化和 logit 輸出，預測更準確，顯示 LLMs 結合聰明資料處理，在臨床預測上很有潛力。 PubMed

Large language model discharge summary preparation using real-world electronic medical record data shows promise.
使用真實世界電子病歷資料進行大型語言模型出院摘要撰寫展現潛力 Intern Med J 2025-05-28

**重點摘要：** 這項研究測試了兩個大型語言模型（LLMs），用來從真實的臨床紀錄自動產生出院摘要，並用一個經過驗證的評分指標來評分他們的結果。兩個模型的表現差不多，顯示LLMs有潛力協助醫師準備出院摘要，進而減輕臨床醫師的行政工作負擔。 PubMed DOI

Evaluation of a large language model to simplify discharge summaries and provide cardiological lifestyle recommendations.
大型語言模型於簡化出院摘要及提供心臟科生活型態建議之評估 Commun Med (Lond) 2025-05-29

這項研究發現，GPT-4o能用簡單易懂的語言重寫心臟科出院摘要，並加入生活建議，讓病人更容易理解。醫療專家認為AI產出的內容正確又安全，但建議較不個人化。未來還需更多研究，才能確保實際應用的安全性。 PubMed DOI

Verifiable Summarization of Electronic Health Records Using Large Language Models to Support Chart Review.
使用大型語言模型驗證性摘要電子健康紀錄以支援病歷審查 medRxiv 2025-06-12

這項研究發現，用大型語言模型自動產生心臟衰竭住院摘要，能幫助部分醫師更快回答問題，且準確率沒變。大多數醫師認為這樣能省時間，也願意使用，但摘要格式要配合個人需求。整體來說，LLM有助提升醫師效率，但摘要內容還需客製化。 PubMed DOI

原始文章

站上相關主題文章列表