原始文章

在電子病歷中找出藥物不良事件(ADEs)很困難,因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時,所以需要自動化工具。這項研究用大型語言模型來偵測ADEs,發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯,顯示通報機制還有很大改進空間。 PubMed DOI


站上相關主題文章列表

新藥開發和不良藥物反應檢測傳統上耗時且成本高,但隨著大規模醫療數據庫和大型語言模型的興起,藥物篩選變得更有效。本研究提出一個自動化高通量藥物篩選流程,具備多項優勢,包括估算藥物與疾病的關聯、整合藥物重新利用與監測、準確解析暴露時間等。研究分析了661萬名患者的數據,發現16,901對藥物-疾病組合顯著降低風險,11,089對則顯著增加風險,顯示出潛在的藥物重新利用和安全問題。這項研究展示了自然語言處理在藥物流行病學中的潛力。 PubMed DOI

這項研究探討大型語言模型(LLMs)在識別接受免疫檢查點抑制劑(ICI)治療患者的免疫相關不良事件(irAEs)中的應用,並與傳統手動裁定及ICD代碼進行比較。研究分析了超過12年的住院紀錄,發現LLMs在檢測irAEs的敏感性顯著高於ICD代碼,且效率更佳,平均每份病歷僅需9.53秒。總體來說,LLMs被認為是檢測irAEs的有效工具,提供更高的敏感性和效率。 PubMed DOI

不良藥物事件(ADEs)對住院率影響顯著,且與高發病率和死亡率相關。傳統的藥物安全監測依賴於不良事件報告系統,但社交媒體如X(前身為Twitter)提供了有價值的患者見解。本研究探討使用大型語言模型(LLMs)進行ADE分類,結果顯示RoBERTa-large模型表現最佳,F1指標達0.8,微調後的ChatGPT則為0.75。特徵分析顯示某些術語在識別ADE中至關重要,顯示LLMs在藥物安全監測中的潛力。 PubMed DOI

與藥物相關的不良事件(AEs)是重要的公共衛生議題,而FDA的藥物標籤文件對於藥物安全性研究至關重要。手動提取不良事件數據既耗時又需專業知識,難以跟上更新。為了解決這個問題,開發了名為AskFDALabel的自動化流程,利用大型語言模型(LLM)和檢索增強生成(RAG)技術。該系統在三個基準實驗中表現優異,DILI的F1分數達0.978,DICT為0.931,顯示出顯著提高不良事件註釋的效率與準確性,對藥物安全研究具有重要潛力。 PubMed DOI

基於變壓器的語言模型在自然語言處理上有顯著進展,但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中,九個預訓練的模型在5,088對藥物-AE數據上微調,並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示,BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測,假陽性減少,精確度提升。整體而言,這些模型在識別因果相關藥物-AE對方面表現優於傳統方法,但仍需額外規則以克服限制。 PubMed DOI

不良藥物事件(ADEs)在臨床試驗中是一大安全挑戰,因此預測這些事件對於開發更安全的藥物至關重要。我們推出了CT-ADE數據集,專注於單一藥物治療中的多標籤ADE預測,包含2,497種藥物和168,984對藥物-ADE配對,數據來自臨床試驗結果,並使用MedDRA標註。CT-ADE整合了治療和目標人群數據,便於比較分析。使用大型語言模型進行分析,最佳模型達到56%的F1分數,顯示上下文信息對預測ADE的重要性,使CT-ADE成為藥物安全風險評估的寶貴資源。 PubMed DOI

這項研究探討了從電子病歷中檢測肺栓塞不良事件的挑戰,並開發了一個利用大型語言模型的框架。研究回顧了2017至2022年間的病歷,發現40例肺栓塞不良事件,流行率為0.4%。框架包含證據提取、出院資訊提取和PEAE檢測三個模組,評估了四個開源模型,結果顯示高敏感性和特異性。研究強調關鍵字過濾和出院摘要的納入能改善性能,並建議未來應加強上下文理解和醫學術語解釋,以提升檢測能力。 PubMed DOI

這篇論文用大型語言模型產生了1.7萬則帶有不良藥物事件標註的合成推文,解決社群媒體上缺乏標註資料的問題。用這些資料預訓練的NER模型,在真實推文上表現更好,經人工標註資料微調後更創新高,證明合成資料能大幅提升ADE偵測效果,且資料集已公開。 PubMed DOI

這項研究發現,ChatGPT 和 Claude 在協助藥物安全專家偵測藥物交互作用(DDIs)方面表現相近,且都優於 Gemini,尤其在簡單案例中。不過,三款大型語言模型的特異性都不高,容易誤判沒有交互作用的情況。總結來說,LLMs 可作為輔助工具,但專業藥師仍不可或缺,特別是在排除不存在的 DDIs 時。 PubMed DOI

這篇研究用標註過的出院摘要,建立大規模資料集,並用多種大型語言模型來偵測八種物質使用情形。經過微調的 Llama-DrugDetector-70B 模型,對大多數物質的偵測準確率很高(F1 分數 ≥ 0.95),但像鴉片類藥物和多重物質使用的偵測還有進步空間。整體來說,LLM 有助提升臨床紀錄中物質使用的辨識,但還需要更多研究才能廣泛應用。 PubMed DOI