Using Large Language Models to Detect and Understand Drug Discontinuation Events in Web-Based Forums: Development and Validation Study.
使用大型語言模型檢測和理解網路論壇中的藥物中斷事件：開發與驗證研究。 J Med Internet Res 2025-01-30

這項研究探討如何利用大型語言模型（LLMs），如BART和GPT-4，從MedHelp論壇的用戶評論中識別藥物停用事件（DDEs）。DDEs對藥物依從性和病人結果至關重要，但研究仍不多。研究人員建立了一個靈活的框架，並發布了首個開源DDE數據集，以促進後續研究。結果顯示，GPT-4o在識別根本原因上表現優異，而BART在檢測DDEs方面最有效。這項研究顯示了LLMs在分析公開數據的潛力，並鼓勵進一步探索。 PubMed DOI

Improving entity recognition using ensembles of deep learning and fine-tuned large language models: A case study on adverse event extraction from VAERS and social media.
使用深度學習和微調大型語言模型的集成來改善實體識別：以從 VAERS 和社交媒體提取不良事件為案例研究。 J Biomed Inform 2025-02-09

這項研究專注於從文本中提取與COVID-19疫苗相關的不良事件資訊，對疫苗安全性監測至關重要。研究比較了大型語言模型（LLMs）和傳統深度學習模型的表現，並探討了模型集成的優勢。使用了VAERS、Twitter和Reddit的數據，識別疫苗、接種和不良事件等實體。多個模型經過微調，最佳集成結果顯示「疫苗」的F1分數為0.878，「接種」為0.930，「不良事件」為0.925，整體微平均F1分數為0.903。研究強調了微調和集成方法在提升性能上的重要性，推進了生物醫學領域的自然語言處理。 PubMed DOI

Leveraging FDA Labeling Documents and Large Language Model to Enhance Annotation, Profiling, and Classification of Drug Adverse Events with AskFDALabel.
利用 FDA 標籤文件和大型語言模型來增強藥物不良事件的註釋、剖析和分類，使用 AskFDALabel。 Drug Saf 2025-02-20

與藥物相關的不良事件（AEs）是重要的公共衛生議題，而FDA的藥物標籤文件對於藥物安全性研究至關重要。手動提取不良事件數據既耗時又需專業知識，難以跟上更新。為了解決這個問題，開發了名為AskFDALabel的自動化流程，利用大型語言模型（LLM）和檢索增強生成（RAG）技術。該系統在三個基準實驗中表現優異，DILI的F1分數達0.978，DICT為0.931，顯示出顯著提高不良事件註釋的效率與準確性，對藥物安全研究具有重要潛力。 PubMed DOI

Effectiveness of Transformer-Based Large Language Models in Identifying Adverse Drug Reaction Relations from Unstructured Discharge Summaries in Singapore.
基於變壓器的大型語言模型在新加坡從非結構化出院摘要中識別不良藥物反應關係的有效性。 Drug Saf 2025-02-21

基於變壓器的語言模型在自然語言處理上有顯著進展，但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中，九個預訓練的模型在5,088對藥物-AE數據上微調，並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示，BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測，假陽性減少，精確度提升。整體而言，這些模型在識別因果相關藥物-AE對方面表現優於傳統方法，但仍需額外規則以克服限制。 PubMed DOI

Probing Large Language Model Hidden States for Adverse Drug Reaction Knowledge.
探討大型語言模型隱藏狀態中的不良藥物反應知識。 medRxiv 2025-02-24

這項研究探討稀疏自編碼器（SAEs）在生物醫學，特別是針對不良藥物反應（ADRs）的應用。研究人員將Gemma2-9b-it模型中的藥物名稱隱藏狀態嵌入轉換為可解釋的特徵，並訓練線性分類器預測ADRs的可能性。結果顯示，對急性腎損傷和腸胃道出血等情況的預測表現良好，AUC-ROC分數高。SAE輸出的線性分類器表現與原始嵌入的神經網絡相當，顯示SAEs能有效保留重要資訊並簡化模型，增強解釋性，適用於藥物監測等生物醫學應用。 PubMed DOI

An Evaluation Benchmark for Adverse Drug Event Prediction from Clinical Trial Results.
從臨床試驗結果預測不良藥物事件的評估基準。 Sci Data 2025-03-12

不良藥物事件（ADEs）在臨床試驗中是一大安全挑戰，因此預測這些事件對於開發更安全的藥物至關重要。我們推出了CT-ADE數據集，專注於單一藥物治療中的多標籤ADE預測，包含2,497種藥物和168,984對藥物-ADE配對，數據來自臨床試驗結果，並使用MedDRA標註。CT-ADE整合了治療和目標人群數據，便於比較分析。使用大型語言模型進行分析，最佳模型達到56%的F1分數，顯示上下文信息對預測ADE的重要性，使CT-ADE成為藥物安全風險評估的寶貴資源。 PubMed DOI

Using Synthetic Health Care Data to Leverage Large Language Models for Named Entity Recognition: Development and Validation Study.
使用合成健康照護數據來利用大型語言模型進行命名實體識別：開發與驗證研究。 J Med Internet Res 2025-03-18

這項研究針對低資源語言，特別是愛沙尼亞語，開發命名實體識別（NER）模型，目的是從醫療記錄中提取重要的醫療實體。由於缺乏標註數據，作者提出三步驟方法：首先，利用本地訓練的GPT-2生成合成醫療數據；接著，使用GPT-3.5-Turbo和GPT-4對這些數據進行標註；最後，微調NER模型並測試真實醫療文本。研究結果顯示，藥物提取的F<sub>1</sub>分數為0.69，程序提取為0.38，顯示出在藥物識別上的有效性，並指出程序提取的挑戰。這方法為未來在其他語言的研究提供了新方向。 PubMed DOI

Detecting Adverse Drug Events in Clinical Notes Using Large Language Models.
使用大型語言模型偵測臨床紀錄中的藥物不良事件 Stud Health Technol Inform 2025-05-17

在電子病歷中找出藥物不良事件（ADEs）很困難，因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時，所以需要自動化工具。這項研究用大型語言模型來偵測ADEs，發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯，顯示通報機制還有很大改進空間。 PubMed DOI

Can large language models detect drug-drug interactions leading to adverse drug reactions?
大型語言模型能否偵測導致不良藥物反應的藥物間交互作用？ Ther Adv Drug Saf 2025-05-19

這項研究發現，ChatGPT 和 Claude 在協助藥物安全專家偵測藥物交互作用（DDIs）方面表現相近，且都優於 Gemini，尤其在簡單案例中。不過，三款大型語言模型的特異性都不高，容易誤判沒有交互作用的情況。總結來說，LLMs 可作為輔助工具，但專業藥師仍不可或缺，特別是在排除不存在的 DDIs 時。 PubMed DOI

Enhancing Substance Use Detection in Clinical Notes with Large Language Models.
利用大型語言模型提升臨床紀錄中物質使用偵測能力 Res Sq 2025-06-05

這篇研究用標註過的出院摘要，建立大規模資料集，並用多種大型語言模型來偵測八種物質使用情形。經過微調的 Llama-DrugDetector-70B 模型，對大多數物質的偵測準確率很高（F1 分數 ≥ 0.95），但像鴉片類藥物和多重物質使用的偵測還有進步空間。整體來說，LLM 有助提升臨床紀錄中物質使用的辨識，但還需要更多研究才能廣泛應用。 PubMed DOI

原始文章

站上相關主題文章列表