The Performance of ChatGPT-4 and Gemini Ultra 1.0 for Quality Assurance Review in Emergency Medical Services Chest Pain Calls.
ChatGPT-4和Gemini Ultra 1.0在急診醫療服務胸痛呼叫的品質保證審查中的表現。 Prehosp Emerg Care 2024-07-08

研究評估了OpenAI的ChatGPT-4和Google的Gemini Ultra大型語言模型在急救醫療服務（EMS）質量保證的應用。大型語言模型有潛力自動化部分病人護理報告處理，減輕醫務主任的工作量。人類審查者表現可靠，ChatGPT-4在某些方面表現不錯，但不夠穩定。Gemini Ultra表現不佳。建議將它們當作輔助工具，並加強培訓和整合，以提升質量保證流程的效能。 PubMed DOI

A pilot feasibility study comparing large language models in extracting key information from ICU patient text records from an Irish population.
一項針對愛爾蘭人群 ICU 患者文本記錄中提取關鍵信息的大型語言模型比較的初步可行性研究。 Intensive Care Med Exp 2024-08-15

這項研究探討大型語言模型（LLMs）在生成重症監護病房（ICU）病人出院摘要的表現，分析了匿名臨床筆記。三個模型中，GPT-4 API的表現最佳，準確識別41.5%的關鍵臨床事件，ChatGPT和Llama 2則分別為19.2%和16.5%。雖然GPT-4在資訊組織和清晰度上表現優異，但仍有小錯誤，且所有模型在敘事連貫性和重要數據的捕捉上存在挑戰。總體來看，這些LLM在生成出院摘要上有潛力，但仍需改進。 PubMed DOI

Generating Synthetic Healthcare Dialogues in Emergency Medicine Using Large Language Models.
利用大型語言模型生成急診醫學中的合成醫療對話。 Stud Health Technol Inform 2024-11-22

自然語言處理（NLP）在放射學等領域展現了將非結構化數據轉為結構化格式的潛力，但隱私問題使得數據集獲取困難。我們的目標是利用大型語言模型（LLMs）從救護人員與病人對話中提取醫療資訊，以填寫緊急應變程序表格。為此，我們開發了一個流程，使用"Zephyr-7b-beta"生成初步對話，再用GPT-4 Turbo進行精煉。初步結果顯示，"Zephyr-7b-beta"的準確率為94%，但經過精煉後略降至87%。這些結果顯示LLMs在醫療對話生成中的潛力與挑戰。 PubMed DOI

Developing and Evaluating Large Language Model-Generated Emergency Medicine Handoff Notes.
開發與評估大型語言模型生成的急診醫學交接筆記。 JAMA Netw Open 2024-12-03

這項研究探討大型語言模型（LLM）生成的急診醫學交接筆記，針對從急診轉入住院的病人進行。研究在紐約長老會/威爾康奈爾醫學中心進行，分析了1,600份病人紀錄。結果顯示，LLM生成的筆記在詞彙和細節上優於醫生撰寫的筆記，但在實用性和病人安全性方面略遜於醫生的評估。這強調了在臨床使用LLM時，醫生參與的重要性，並提供了評估病人安全的框架。 PubMed DOI

Use of a large language model (LLM) for ambulance dispatch and triage.
大型語言模型 (LLM) 在救護車調度和分診中的應用。 Am J Emerg Med 2024-12-15

最近大型語言模型（LLMs）在臨床推理方面的進展顯示出其在緊急醫療服務（EMS）中分診病人的潛力。一項研究測試了ChatGPT 4o Mini在美國某大城市的真實數據中，優先處理救護車請求的能力。結果顯示，該模型與經驗豐富的救護員意見一致的比例達76.5%，而在救護員達成共識的情況下，這一比例高達93.8%。這些發現顯示LLMs在緊急護理中可能成為有價值的工具，但仍需進一步研究以確定最佳應用方式。 PubMed DOI

Large language models for data extraction from unstructured and semi-structured electronic health records: a multiple model performance evaluation.
從非結構化和半結構化電子健康紀錄中提取數據的大型語言模型：多模型性能評估。 BMJ Health Care Inform 2025-01-20

這項研究評估了多種大型語言模型（LLMs）在從電子健康紀錄中提取數據的表現，使用了50份合成醫療筆記。共測試了18個LLM，並與基準模型RoBERTa比較，涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等，準確率超過0.98，明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性，顯示出能有效協助數據提取，減輕醫療人員的負擔。不過，仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

Critical care studies using large language models based on electronic healthcare records: A technical note.
基於電子健康紀錄應用大型語言模型於重症醫學研究之技術說明 J Intensive Med 2025-04-17

這份技術說明介紹大型語言模型（如 GPT-4、Qwen-Chat）如何分析電子病歷，協助快速評估病患、預測敗血症及自動產生加護病房出院摘要。內容也說明如何用 DashScope API 把 LLMs 整合進臨床流程，並提供實用指引，幫助醫師和研究人員提升照護品質與推動個人化醫療。 PubMed DOI

Large language models in critical care.
重症醫療中的大型語言模型 J Intensive Med 2025-04-17

大型語言模型像 ChatGPT 正在改變重症醫學，能自動化病歷、協助決策、個人化溝通，還能整理非結構化資料。不過，目前還有資訊正確性、倫理和醫師AI素養等挑戰。結合傳統機器學習可降低風險，導入時要謹慎並加強醫師訓練，才能提升照護品質。 PubMed DOI

Large language model discharge summary preparation using real-world electronic medical record data shows promise.
使用真實世界電子病歷資料進行大型語言模型出院摘要撰寫展現潛力 Intern Med J 2025-05-28

**重點摘要：** 這項研究測試了兩個大型語言模型（LLMs），用來從真實的臨床紀錄自動產生出院摘要，並用一個經過驗證的評分指標來評分他們的結果。兩個模型的表現差不多，顯示LLMs有潛力協助醫師準備出院摘要，進而減輕臨床醫師的行政工作負擔。 PubMed DOI

Verifiable Summarization of Electronic Health Records Using Large Language Models to Support Chart Review.
使用大型語言模型驗證性摘要電子健康紀錄以支援病歷審查 medRxiv 2025-06-12

這項研究發現，用大型語言模型自動產生心臟衰竭住院摘要，能幫助部分醫師更快回答問題，且準確率沒變。大多數醫師認為這樣能省時間，也願意使用，但摘要格式要配合個人需求。整體來說，LLM有助提升醫師效率，但摘要內容還需客製化。 PubMed DOI

原始文章

站上相關主題文章列表