原始文章

這項研究發現,微調過的BERT模型在分類病人安全事件報告時,比傳統CNN模型更能準確辨識罕見事件和嚴重程度,且在新資料上也有不錯表現。即使資料量少或分布不均,BERT只用預設參數就能有很好的效果,顯示其在醫療文本分類上相當有潛力。 PubMed DOI


站上相關主題文章列表

這項研究比較了兩種模型在預測住院情況的表現,分別是深度學習模型Bio-Clinical-BERT和詞袋邏輯回歸模型BOW-LR-TF-IDF。研究基於Mount Sinai Health System近140萬名患者的數據,結果顯示Bio-Clinical-BERT的接收者操作特徵曲線下面積(AUC)得分為0.82到0.85,優於BOW-LR-TF-IDF的0.81到0.84。雖然兩者性能差異不大,但都能有效利用分診筆記進行預測。研究強調在資源有限的情況下,簡單模型也能滿足需求,並建議進一步研究以提升醫療預測能力。 PubMed DOI

這項研究評估了GPT-3.5這種大型語言模型在自動標記產科事件報告的效果。分析了370份住院產科報告,並以人類標註作為金標準。結果顯示,該模型的敏感度達85.7%,特異度為97.9%,使用了79個標籤,而人類僅用了49個。模型的標籤解釋也有60.8%獲得審核者認可。總體來看,GPT-3.5能提升事件報告系統的數據利用效率,並可能改善病人安全。 PubMed DOI

這項研究開發了一種計算方法,利用臨床語言模型來檢測醫療環境中的跌倒事件,並改善自我報告系統。研究分析了34,480份來自三家醫院的護理筆記和病人安全報告,並使用BERT和GPT-4模型進行測試。結果顯示,經過微調的BERT模型表現最佳,F1分數達0.98。研究指出,結合臨床語言模型與自我報告能顯著提升跌倒事件的識別率,解決91%的報告不足問題,並減輕護理人員的負擔。 PubMed DOI

跌倒是醫院常見的不良事件,對患者及醫療系統影響深遠。本研究旨在利用大型語言模型(LLMs)自動編碼住院跌倒記錄,提取跌倒地點及受傷情況。研究分析了187條跌倒事件,使用GPT-4-turbo模型進行數據分類,結果顯示模型在地點和受傷檢測上表現優異,準確率均超過0.913及0.953。結論指出,GPT模型能有效從未優化文本中提取信息,顯示其在臨床風險管理中的潛力。 PubMed DOI

這項研究探討了使用遮蔽語言模型(MLM)在醫院特定領域的適應性,並應用於基於BERT的模型來分類神經放射學報告。分析了來自國王學院醫院和蓋伊與聖托馬斯信託醫院的超過200,000份MRI報告。結果顯示,經過適應的模型性能顯著提升,最佳訓練數據達到97.0%和95.5%的準確率。Llama-3.0 70B模型表現最佳,準確率分別為97.1%和94.0%。研究建議在臨床環境中使用醫院特定的模型適應,並指出LLM可作為有效替代方案。 PubMed DOI

這項研究用大型語言模型(像RoBERTa和PubMedBERT)分析麻醉門診紀錄,成功辨識出病人術前的虛弱狀態,不論用哪種虛弱定義,模型表現都很準確。結果證明,LLM能有效從日常臨床紀錄中抓出像虛弱這種複雜的健康問題。 PubMed DOI

這個專案用標準化流程和大型語言模型來分析MAUDE資料庫裡醫療器材報告的自由敘述,提升事件分類的準確率和效率。以內視鏡黏膜切除術為例,這方法也能應用到其他醫材。不過,若要做更全面的病人安全研究,還需要更多元且大量的報告樣本。 PubMed DOI

**重點整理:** 大型語言模型可以準確分類安全事件通報(例如:職場暴力、溝通失誤),協助醫療機構快速掌握安全趨勢,並透過自動化分析來提升職場安全。 PubMed

這項研究發現,像 Med-BERT 這種專為醫療設計的大型語言模型,比通用型模型更能處理不同醫院間的資料差異,提升知識轉移效果。通用模型如 OpenAI 需額外微調。未來建議持續研究如何在任務難度、資料量和微調之間取得最佳平衡。 PubMed

這篇文獻回顧指出,GPT類模型適合用在醫療溝通、報告撰寫等任務,BERT類模型則較適合做分類和知識挖掘。由於兩者架構不同,適用場景也不一樣,醫療人員應根據實際需求選擇合適的模型。 PubMed DOI