原始文章

**重點整理:** 大型語言模型可以準確分類安全事件通報(例如:職場暴力、溝通失誤),協助醫療機構快速掌握安全趨勢,並透過自動化分析來提升職場安全。 PubMed


站上相關主題文章列表

大型語言模型(LLMs)在臨床決策中或許有好處,但目前還不適合實際醫療使用。一項研究指出,LLMs在真實病例中無法正確診斷、無法遵循指引、難以解釋檢驗結果,且難以整合到臨床流程中,可能危害患者健康。需要更多研究以改進LLMs在臨床決策的應用。 PubMed DOI

這項研究評估了GPT-3.5這種大型語言模型在自動標記產科事件報告的效果。分析了370份住院產科報告,並以人類標註作為金標準。結果顯示,該模型的敏感度達85.7%,特異度為97.9%,使用了79個標籤,而人類僅用了49個。模型的標籤解釋也有60.8%獲得審核者認可。總體來看,GPT-3.5能提升事件報告系統的數據利用效率,並可能改善病人安全。 PubMed DOI

病人安全事件(PSE)報告的分析對提升病人安全非常重要,但報告中的語言混雜,造成挑戰。本研究提出數據驅動的評估策略,檢視大型語言模型(LLMs)在分析PSE報告的適用性。研究發現,LLMs在七個事件類別中有六個類別的困惑度存在顯著差異。臨床模型對醫療專業人員撰寫的臨床敘述理解較好,而通用模型則在口語化語言和溝通主題上表現較佳。研究結論指出,LLMs需與文本特徵強烈對齊,單一模型可能無法最佳分析PSE報告。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)從兒童保護服務(CPS)的案例報告中提取結構化數據,特別是識別不同的暴力子類型。研究流程分為四個階段,並分析了來自瑞士的29,770份報告,提取了28,223個文本段落。表現最佳的模型Mixtral-8x7B在文本分類中達到87%的準確率,超過人類審查員的77%協議率。結果顯示,LLMs能有效模擬人類的編碼能力,提升CPS研究的質量,但也需注意文本分段的弱點及潛在偏見。 PubMed DOI

這項研究探討交通事故報告中的低報問題,這會影響交通安全措施的發展。傳統修正方法慢且易出錯,特別是處理大數據時。作者提出一個框架,利用大型語言模型(LLMs)分析事故敘述,識別低報因素,如酒精參與。研究團隊用麻薩諸塞州的500份事故報告進行案例研究,結果顯示高準確率,召回率達1.0,精確率0.93,成功識別低報情況。這方法提升了交通安全分析的效率,未來可改善事故記錄質量,支持更有效的安全對策。 PubMed DOI

安全規劃介入忠實度評估工具(SPIFR)是一個自動化工具,專門用來評估自殺風險管理的安全規劃介入(SPI)質量。它利用三個大型語言模型(LLMs)分析了266個去識別化的SPI,重點在於警示徵兆、內部應對策略、安全環境及生存理由。研究發現,LLaMA 3和o3-mini的表現優於GPT-4,並針對每個步驟提出了最佳評分系統。這顯示大型語言模型在提供臨床醫師即時且準確的反饋方面的潛力,有助於提升自殺預防策略的有效性。 PubMed DOI

MAUDE資料庫追蹤醫療器材的不良事件,最近受到更多關注,但報告中的敘述常被忽略,導致重要見解流失。為了解決這個問題,我們使用大型語言模型(LLMs),特別是OpenAI的GPT-4-turbo,來分析內視鏡夾相關的MAUDE報告,識別未編碼的手術程序並提取額外見解。這種方法顯示LLMs在處理敘述數據上的有效性,提供比傳統分析更高效且具成本效益的替代方案,最終能將MAUDE報告轉化為臨床實踐的可行知識。 PubMed DOI

這個專案用標準化流程和大型語言模型來分析MAUDE資料庫裡醫療器材報告的自由敘述,提升事件分類的準確率和效率。以內視鏡黏膜切除術為例,這方法也能應用到其他醫材。不過,若要做更全面的病人安全研究,還需要更多元且大量的報告樣本。 PubMed DOI

在電子病歷中找出藥物不良事件(ADEs)很困難,因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時,所以需要自動化工具。這項研究用大型語言模型來偵測ADEs,發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯,顯示通報機制還有很大改進空間。 PubMed DOI

這項研究用機器學習分析職場問卷,提出新特徵選擇法,找出39個關鍵壓力指標,並結合多種模型,準確率超過九成,優於過去研究。方法經多重驗證,對新資料也有效。研究還用1D-CNN和創新資料轉換,讓語言模型能處理問卷資料。結果顯示,壓力和生物醫學因素關聯高,主要壓力來自工作量、溝通和環境。只需問卷即可即時監測職場壓力,實用性高。 PubMed DOI