Evaluating LLMs for Diagnosis Summarization.
評估大型語言模型在診斷摘要中的應用。 Annu Int Conf IEEE Eng Med Biol Soc 2025-03-05

這篇論文探討了六種大型語言模型（LLMs）在自動化出院摘要方面的有效性，並提出了一種新的自動評估指標，與人類評估結果相符。研究使用F1-Score來評估模型表現，並與醫療專業人員的評估進行比較。結果顯示，雖然LLMs有潛力，但在醫學知識和診斷能力上仍需改進。實驗的源代碼和數據可在GitHub上找到。 PubMed DOI

Use of Open-Source Large Language Models for Automatic Synthesis of the Entire Imaging Medical Records of Patients: A Feasibility Study.
開源大型語言模型於自動整合病患完整影像醫療紀錄之應用：可行性研究 Tomography 2025-04-25

這項研究用三種開源AI模型自動摘要病人影像檢查紀錄，經專業醫師評估，發現AI摘要內容準確、實用又好上手。這樣能幫醫師快速掌握重點，省下查閱時間，資訊品質也沒打折，對放射科工作流程很有幫助。 PubMed DOI

Physician- and Large Language Model-Generated Hospital Discharge Summaries.
醫師與大型語言模型生成的出院摘要 JAMA Intern Med 2025-05-05

研究發現，大型語言模型（LLM）生成的出院摘要，品質和醫師寫的差不多，受歡迎程度也相近。LLM寫的內容比較精簡、結構清楚，但資訊沒那麼完整，錯誤率也稍高。不過這些錯誤通常不會造成傷害。只要有醫師審核，LLM生成的摘要很有機會成為醫院的好幫手。 PubMed DOI

Evaluating large language model workflows in clinical decision support for triage and referral and diagnosis.
臨床決策支援中大型語言模型於分診、轉診與診斷流程的評估 NPJ Digit Med 2025-05-09

**重點摘要：** 這項研究評估了多個大型語言模型（LLMs）以及一個檢索增強生成（RAG）流程，並以2,000個醫療案例作為測試。結果顯示，LLMs能夠協助病人和臨床醫師，像是提供可能的診斷、建議合適的專科醫師，以及評估緊急程度，有機會提升醫療決策品質和醫療服務的效率。 PubMed DOI

Automated generation of discharge summaries: leveraging large language models with clinical data.
自動生成出院摘要：結合臨床資料與大型語言模型 Sci Rep 2025-05-12

這項研究用開源大型語言模型（像LLaMA3）自動產生德文出院摘要，並請醫師評估品質。結果顯示，AI生成的摘要資訊算完整，但常漏掉重要細節或出現錯誤，尤其在複雜病例時更明顯。研究也發現資料集太小、資料不全和模型德文醫學詞彙不足是主要挑戰，建議未來要用更多資料和微調模型，才能提升表現。 PubMed DOI

Assessment and Integration of Large Language Models for Automated Electronic Health Record Documentation in Emergency Medical Services.
大型語言模型於緊急醫療服務自動化電子病歷紀錄之評估與整合 J Med Syst 2025-05-17

這項研究用多個大型語言模型（像是GPT-4、Claude 3.5等）來自動化產生EMS對話的電子病歷，結果比單一模型更準確，F1分數最高到0.81。專家也認為這系統能減輕紀錄負擔，但偶爾還是會誤解醫療情境。這是首次針對急診醫療紀錄自動化做系統性評估，展現未來應用潛力。 PubMed DOI

Optimizing Large Language Models for Discharge Prediction: Best Practices in Leveraging Electronic Health Record Audit Logs.
最佳化大型語言模型於出院預測：運用電子病歷稽核紀錄的最佳實務 AMIA Annu Symp Proc 2025-05-26

這項研究發現，經過微調的 LLaMA-2 70B 模型，能有效運用電子病歷稽核紀錄來預測病人出院時間，表現比 GPT-4 和 DeBERTa 更好。採用「首次出現」事件序列化和 logit 輸出，預測更準確，顯示 LLMs 結合聰明資料處理，在臨床預測上很有潛力。 PubMed

Evaluation of a large language model to simplify discharge summaries and provide cardiological lifestyle recommendations.
大型語言模型於簡化出院摘要及提供心臟科生活型態建議之評估 Commun Med (Lond) 2025-05-29

這項研究發現，GPT-4o能用簡單易懂的語言重寫心臟科出院摘要，並加入生活建議，讓病人更容易理解。醫療專家認為AI產出的內容正確又安全，但建議較不個人化。未來還需更多研究，才能確保實際應用的安全性。 PubMed DOI

Verifiable Summarization of Electronic Health Records Using Large Language Models to Support Chart Review.
使用大型語言模型驗證性摘要電子健康紀錄以支援病歷審查 medRxiv 2025-06-12

這項研究發現，用大型語言模型自動產生心臟衰竭住院摘要，能幫助部分醫師更快回答問題，且準確率沒變。大多數醫師認為這樣能省時間，也願意使用，但摘要格式要配合個人需求。整體來說，LLM有助提升醫師效率，但摘要內容還需客製化。 PubMed DOI

Using large language models to extract information from pediatric clinical reports.
利用大型語言模型從兒科臨床報告中擷取資訊 PLOS Digit Health 2025-07-23

大部分醫療紀錄都是非結構化，讓資料分析很困難。這項研究測試九種大型語言模型，能自動從兒科臨床報告擷取結構化資料。不論是商業還是開源模型，表現都很優秀，最好的模型辨識重要病患資訊的準確率超過九成。LLMs為醫療資料擷取提供靈活又準確的替代方案，有機會取代人工處理。 PubMed DOI

原始文章

站上相關主題文章列表