原始文章

這個專案用標準化流程和大型語言模型來分析MAUDE資料庫裡醫療器材報告的自由敘述,提升事件分類的準確率和效率。以內視鏡黏膜切除術為例,這方法也能應用到其他醫材。不過,若要做更全面的病人安全研究,還需要更多元且大量的報告樣本。 PubMed DOI


站上相關主題文章列表

MAUDE 資料庫提供醫療器材故障和不良事件的重要資訊,但其複雜性讓人難以使用。為了解決這個問題,我們開發了一個自動化分析管道,利用 GPT-4 語言模型,能高效提取、分類和視覺化安全事件,並且人力需求極少。在對 4,459 份結腸鏡檢查報告的研究中,我們將事件分為操作性、人為因素和設備相關類別,並使用石川圖視覺化數據,方便檢索和比較。這種創新方法簡化了安全資訊的獲取,減輕了人力負擔,提升了 MAUDE 的效用。 PubMed DOI

哨兵系統是美國FDA用來監控藥物安全的重要工具,透過臨床數據來指導藥物標籤和安全通訊。然而,觀察性數據的可靠性常受到挑戰。最近,大型語言模型(LLMs)的進展為解決這些問題提供了新機會,能從電子健康紀錄中識別不良事件並支持流行病學研究。不過,LLMs的準確性依賴於有效的提示工程,且其基礎設施在醫療系統中並不普遍,可能影響數據分析的公平性。此外,LLMs可能產生不準確的信息,導致假陽性,影響監管評估。因此,雖然LLMs有潛力改善上市後監測,但仍需努力確保公平性和準確性。 PubMed DOI

本研究評估大型語言模型(LLM),特別是GPT-4,是否能有效分析介入放射學(IR)微波消融裝置的安全事件數據。研究收集了2011年至2023年的安全數據,並由人類審核者進行分類。GPT-4的分類準確率在訓練集達96.0%,驗證集86.4%,測試集87.3%。最終生成的摘要與人類解讀相似,顯示LLM在處理IR安全數據方面的潛力,成為臨床醫生的有用工具。 PubMed DOI

這項研究評估了GPT-3.5這種大型語言模型在自動標記產科事件報告的效果。分析了370份住院產科報告,並以人類標註作為金標準。結果顯示,該模型的敏感度達85.7%,特異度為97.9%,使用了79個標籤,而人類僅用了49個。模型的標籤解釋也有60.8%獲得審核者認可。總體來看,GPT-3.5能提升事件報告系統的數據利用效率,並可能改善病人安全。 PubMed DOI

這項研究探討大型語言模型(LLM)生成的急診醫學交接筆記,針對從急診轉入住院的病人進行。研究在紐約長老會/威爾康奈爾醫學中心進行,分析了1,600份病人紀錄。結果顯示,LLM生成的筆記在詞彙和細節上優於醫生撰寫的筆記,但在實用性和病人安全性方面略遜於醫生的評估。這強調了在臨床使用LLM時,醫生參與的重要性,並提供了評估病人安全的框架。 PubMed DOI

這項研究探討了從電子病歷中檢測肺栓塞不良事件的挑戰,並開發了一個利用大型語言模型的框架。研究回顧了2017至2022年間的病歷,發現40例肺栓塞不良事件,流行率為0.4%。框架包含證據提取、出院資訊提取和PEAE檢測三個模組,評估了四個開源模型,結果顯示高敏感性和特異性。研究強調關鍵字過濾和出院摘要的納入能改善性能,並建議未來應加強上下文理解和醫學術語解釋,以提升檢測能力。 PubMed DOI

MAUDE資料庫追蹤醫療器材的不良事件,最近受到更多關注,但報告中的敘述常被忽略,導致重要見解流失。為了解決這個問題,我們使用大型語言模型(LLMs),特別是OpenAI的GPT-4-turbo,來分析內視鏡夾相關的MAUDE報告,識別未編碼的手術程序並提取額外見解。這種方法顯示LLMs在處理敘述數據上的有效性,提供比傳統分析更高效且具成本效益的替代方案,最終能將MAUDE報告轉化為臨床實踐的可行知識。 PubMed DOI

臨床試驗中,方案偏差(PDs)定義不一,難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型,開發自動化系統,能快速分類Roche系統裡的PDs,自動標記出超過八成可能影響結果的PDs,讓專家能聚焦審查,大幅提升效率,幾分鐘就能得到有用見解。 PubMed DOI

在電子病歷中找出藥物不良事件(ADEs)很困難,因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時,所以需要自動化工具。這項研究用大型語言模型來偵測ADEs,發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯,顯示通報機制還有很大改進空間。 PubMed DOI

**重點整理:** 大型語言模型可以準確分類安全事件通報(例如:職場暴力、溝通失誤),協助醫療機構快速掌握安全趨勢,並透過自動化分析來提升職場安全。 PubMed