Leveraging FDA Labeling Documents and Large Language Model to Enhance Annotation, Profiling, and Classification of Drug Adverse Events with AskFDALabel.
利用 FDA 標籤文件和大型語言模型來增強藥物不良事件的註釋、剖析和分類，使用 AskFDALabel。 Drug Saf 2025-02-20

與藥物相關的不良事件（AEs）是重要的公共衛生議題，而FDA的藥物標籤文件對於藥物安全性研究至關重要。手動提取不良事件數據既耗時又需專業知識，難以跟上更新。為了解決這個問題，開發了名為AskFDALabel的自動化流程，利用大型語言模型（LLM）和檢索增強生成（RAG）技術。該系統在三個基準實驗中表現優異，DILI的F1分數達0.978，DICT為0.931，顯示出顯著提高不良事件註釋的效率與準確性，對藥物安全研究具有重要潛力。 PubMed DOI

Effectiveness of Transformer-Based Large Language Models in Identifying Adverse Drug Reaction Relations from Unstructured Discharge Summaries in Singapore.
基於變壓器的大型語言模型在新加坡從非結構化出院摘要中識別不良藥物反應關係的有效性。 Drug Saf 2025-02-21

基於變壓器的語言模型在自然語言處理上有顯著進展，但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中，九個預訓練的模型在5,088對藥物-AE數據上微調，並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示，BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測，假陽性減少，精確度提升。整體而言，這些模型在識別因果相關藥物-AE對方面表現優於傳統方法，但仍需額外規則以克服限制。 PubMed DOI

An Evaluation Benchmark for Adverse Drug Event Prediction from Clinical Trial Results.
從臨床試驗結果預測不良藥物事件的評估基準。 Sci Data 2025-03-12

不良藥物事件（ADEs）在臨床試驗中是一大安全挑戰，因此預測這些事件對於開發更安全的藥物至關重要。我們推出了CT-ADE數據集，專注於單一藥物治療中的多標籤ADE預測，包含2,497種藥物和168,984對藥物-ADE配對，數據來自臨床試驗結果，並使用MedDRA標註。CT-ADE整合了治療和目標人群數據，便於比較分析。使用大型語言模型進行分析，最佳模型達到56%的F1分數，顯示上下文信息對預測ADE的重要性，使CT-ADE成為藥物安全風險評估的寶貴資源。 PubMed DOI

Utilizing large language models for detecting hospital-acquired conditions: an empirical study on pulmonary embolism.
利用大型語言模型檢測醫院獲得的病症：針對肺栓塞的實證研究。 J Am Med Inform Assoc 2025-03-19

這項研究探討了從電子病歷中檢測肺栓塞不良事件的挑戰，並開發了一個利用大型語言模型的框架。研究回顧了2017至2022年間的病歷，發現40例肺栓塞不良事件，流行率為0.4%。框架包含證據提取、出院資訊提取和PEAE檢測三個模組，評估了四個開源模型，結果顯示高敏感性和特異性。研究強調關鍵字過濾和出院摘要的納入能改善性能，並建議未來應加強上下文理解和醫學術語解釋，以提升檢測能力。 PubMed DOI

Leveraging Large Language Models for Synthetic Data Generation to Enhance Adverse Drug Event Detection in Tweets.
運用大型語言模型生成合成數據以提升推特中不良藥物事件偵測能力 Stud Health Technol Inform 2025-05-17

這篇論文用大型語言模型產生了1.7萬則帶有不良藥物事件標註的合成推文，解決社群媒體上缺乏標註資料的問題。用這些資料預訓練的NER模型，在真實推文上表現更好，經人工標註資料微調後更創新高，證明合成資料能大幅提升ADE偵測效果，且資料集已公開。 PubMed DOI

Can large language models detect drug-drug interactions leading to adverse drug reactions?
大型語言模型能否偵測導致不良藥物反應的藥物間交互作用？ Ther Adv Drug Saf 2025-05-19

這項研究發現，ChatGPT 和 Claude 在協助藥物安全專家偵測藥物交互作用（DDIs）方面表現相近，且都優於 Gemini，尤其在簡單案例中。不過，三款大型語言模型的特異性都不高，容易誤判沒有交互作用的情況。總結來說，LLMs 可作為輔助工具，但專業藥師仍不可或缺，特別是在排除不存在的 DDIs 時。 PubMed DOI

A Large Language Model Outperforms Other Computational Approaches to the High-Throughput Phenotyping of Physician Notes.
大型語言模型在醫師筆記高通量表現型分析中優於其他計算方法 AMIA Annu Symp Proc 2025-05-26

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現，GPT-4表現最好，顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具，有助於推動精準醫療發展。 PubMed

Large language model discharge summary preparation using real-world electronic medical record data shows promise.
使用真實世界電子病歷資料進行大型語言模型出院摘要撰寫展現潛力 Intern Med J 2025-05-28

**重點摘要：** 這項研究測試了兩個大型語言模型（LLMs），用來從真實的臨床紀錄自動產生出院摘要，並用一個經過驗證的評分指標來評分他們的結果。兩個模型的表現差不多，顯示LLMs有潛力協助醫師準備出院摘要，進而減輕臨床醫師的行政工作負擔。 PubMed DOI

Enhancing Substance Use Detection in Clinical Notes with Large Language Models.
利用大型語言模型提升臨床紀錄中物質使用偵測能力 Res Sq 2025-06-05

這篇研究用標註過的出院摘要，建立大規模資料集，並用多種大型語言模型來偵測八種物質使用情形。經過微調的 Llama-DrugDetector-70B 模型，對大多數物質的偵測準確率很高（F1 分數 ≥ 0.95），但像鴉片類藥物和多重物質使用的偵測還有進步空間。整體來說，LLM 有助提升臨床紀錄中物質使用的辨識，但還需要更多研究才能廣泛應用。 PubMed DOI

Using large language models to extract information from pediatric clinical reports.
利用大型語言模型從兒科臨床報告中擷取資訊 PLOS Digit Health 2025-07-23

大部分醫療紀錄都是非結構化，讓資料分析很困難。這項研究測試九種大型語言模型，能自動從兒科臨床報告擷取結構化資料。不論是商業還是開源模型，表現都很優秀，最好的模型辨識重要病患資訊的準確率超過九成。LLMs為醫療資料擷取提供靈活又準確的替代方案，有機會取代人工處理。 PubMed DOI

原始文章

站上相關主題文章列表