Traditional Machine Learning, Deep Learning, and BERT (Large Language Model) Approaches for Predicting Hospitalizations From Nurse Triage Notes: Comparative Evaluation of Resource Management.
從護理分診筆記預測住院的傳統機器學習、深度學習和 BERT（大型語言模型）方法：資源管理的比較評估。 JMIR AI 2024-08-27

這項研究比較了兩種模型在預測住院情況的表現，分別是深度學習模型Bio-Clinical-BERT和詞袋邏輯回歸模型BOW-LR-TF-IDF。研究基於Mount Sinai Health System近140萬名患者的數據，結果顯示Bio-Clinical-BERT的接收者操作特徵曲線下面積（AUC）得分為0.82到0.85，優於BOW-LR-TF-IDF的0.81到0.84。雖然兩者性能差異不大，但都能有效利用分診筆記進行預測。研究強調在資源有限的情況下，簡單模型也能滿足需求，並建議進一步研究以提升醫療預測能力。 PubMed DOI

Accuracy of a Proprietary Large Language Model in Labeling Obstetric Incident Reports.
專有大型語言模型在標記產科事件報告中的準確性。 Jt Comm J Qual Patient Saf 2024-09-10

這項研究評估了GPT-3.5這種大型語言模型在自動標記產科事件報告的效果。分析了370份住院產科報告，並以人類標註作為金標準。結果顯示，該模型的敏感度達85.7%，特異度為97.9%，使用了79個標籤，而人類僅用了49個。模型的標籤解釋也有60.8%獲得審核者認可。總體來看，GPT-3.5能提升事件報告系統的數據利用效率，並可能改善病人安全。 PubMed DOI

Enhancing Adverse Event Reporting With Clinical Language Models: Inpatient Falls.
利用臨床語言模型增強不良事件報告：住院病人跌倒。 J Adv Nurs 2025-02-13

這項研究開發了一種計算方法，利用臨床語言模型來檢測醫療環境中的跌倒事件，並改善自我報告系統。研究分析了34,480份來自三家醫院的護理筆記和病人安全報告，並使用BERT和GPT-4模型進行測試。結果顯示，經過微調的BERT模型表現最佳，F1分數達0.98。研究指出，結合臨床語言模型與自我報告能顯著提升跌倒事件的識別率，解決91%的報告不足問題，並減輕護理人員的負擔。 PubMed DOI

A Large Language Model-Based Approach for Coding Information from Free-Text Reported in Fall Risk Surveillance Systems: New Opportunities for In-Hospital Risk Management.
基於大型語言模型的自由文本報告編碼信息的方法：住院風險管理的新機會。 J Clin Med 2025-03-17

跌倒是醫院常見的不良事件，對患者及醫療系統影響深遠。本研究旨在利用大型語言模型（LLMs）自動編碼住院跌倒記錄，提取跌倒地點及受傷情況。研究分析了187條跌倒事件，使用GPT-4-turbo模型進行數據分類，結果顯示模型在地點和受傷檢測上表現優異，準確率均超過0.913及0.953。結論指出，GPT模型能有效從未優化文本中提取信息，顯示其在臨床風險管理中的潛力。 PubMed DOI

Impact of hospital-specific domain adaptation on BERT-based models to classify neuroradiology reports.
醫院特定領域適應對基於 BERT 模型分類神經放射學報告的影響。 Eur Radiol 2025-03-18

這項研究探討了使用遮蔽語言模型（MLM）在醫院特定領域的適應性，並應用於基於BERT的模型來分類神經放射學報告。分析了來自國王學院醫院和蓋伊與聖托馬斯信託醫院的超過200,000份MRI報告。結果顯示，經過適應的模型性能顯著提升，最佳訓練數據達到97.0%和95.5%的準確率。Llama-3.0 70B模型表現最佳，準確率分別為97.1%和94.0%。研究建議在臨床環境中使用醫院特定的模型適應，並指出LLM可作為有效替代方案。 PubMed DOI

A Large Language Model Approach to Identifying Preoperative Frailty Among Older Adults From Clinical Notes.
利用大型語言模型從臨床紀錄中辨識老年人術前虛弱狀態之方法 J Am Geriatr Soc 2025-05-15

這項研究用大型語言模型（像RoBERTa和PubMedBERT）分析麻醉門診紀錄，成功辨識出病人術前的虛弱狀態，不論用哪種虛弱定義，模型表現都很準確。結果證明，LLM能有效從日常臨床紀錄中抓出像虛弱這種複雜的健康問題。 PubMed DOI

Leveraging Data Pipeline and LLM to Advance Patient Safety Event Studies.
運用資料流程與LLM以促進病人安全事件研究 Stud Health Technol Inform 2025-05-17

這個專案用標準化流程和大型語言模型來分析MAUDE資料庫裡醫療器材報告的自由敘述，提升事件分類的準確率和效率。以內視鏡黏膜切除術為例，這方法也能應用到其他醫材。不過，若要做更全面的病人安全研究，還需要更多元且大量的報告樣本。 PubMed DOI

Automatically Identifying Event Reports of Workplace Violence and Communication Failures using Large Language Models.
使用大型語言模型自動識別職場暴力事件報告與溝通失誤 AMIA Jt Summits Transl Sci Proc 2025-06-12

**重點整理：** 大型語言模型可以準確分類安全事件通報（例如：職場暴力、溝通失誤），協助醫療機構快速掌握安全趨勢，並透過自動化分析來提升職場安全。 PubMed

Transfer Learning with Clinical Concept Embeddings from Large Language.
來自大型語言模型的臨床概念嵌入之遷移學習 AMIA Jt Summits Transl Sci Proc 2025-06-12

這項研究發現，像 Med-BERT 這種專為醫療設計的大型語言模型，比通用型模型更能處理不同醫院間的資料差異，提升知識轉移效果。通用模型如 OpenAI 需額外微調。未來建議持續研究如何在任務難度、資料量和微調之間取得最佳平衡。 PubMed

Large Language Model Architectures in Health Care: Scoping Review of Research Perspectives.
醫療保健中大型語言模型架構：研究觀點的範疇性回顧 J Med Internet Res 2025-06-20

這篇文獻回顧指出，GPT類模型適合用在醫療溝通、報告撰寫等任務，BERT類模型則較適合做分類和知識挖掘。由於兩者架構不同，適用場景也不一樣，醫療人員應根據實際需求選擇合適的模型。 PubMed DOI

原始文章

站上相關主題文章列表