Improving entity recognition using ensembles of deep learning and fine-tuned large language models: A case study on adverse event extraction from VAERS and social media.
使用深度學習和微調大型語言模型的集成來改善實體識別：以從 VAERS 和社交媒體提取不良事件為案例研究。 J Biomed Inform 2025-02-09

這項研究專注於從文本中提取與COVID-19疫苗相關的不良事件資訊，對疫苗安全性監測至關重要。研究比較了大型語言模型（LLMs）和傳統深度學習模型的表現，並探討了模型集成的優勢。使用了VAERS、Twitter和Reddit的數據，識別疫苗、接種和不良事件等實體。多個模型經過微調，最佳集成結果顯示「疫苗」的F1分數為0.878，「接種」為0.930，「不良事件」為0.925，整體微平均F1分數為0.903。研究強調了微調和集成方法在提升性能上的重要性，推進了生物醫學領域的自然語言處理。 PubMed DOI

Artificial Intelligence: An Emerging Tool for Studying Drug-Induced Liver Injury.
人工智慧：研究藥物引起的肝損傷的新興工具。 Liver Int 2025-02-21

藥物引起的肝損傷（DILI）因其複雜性及與其他肝病相似，對公共健康造成重大風險，診斷上相當困難。缺乏特定生物標記使得識別更具挑戰性。DILI 可能導致急性肝衰竭，因此了解其機制至關重要。近期人工智慧（AI）的進展為 DILI 研究提供了新方法，尤其是隨著數據集的增多。本文探討 AI 在 DILI 研究中的應用，包括風險分層、預後評估及因果關係分析，並強調自然語言處理（NLP）和大型語言模型（LLM）的臨床應用。最後，討論未來挑戰及持續探索的必要性，以改善 DILI 的診斷與管理。 PubMed DOI

Effectiveness of Transformer-Based Large Language Models in Identifying Adverse Drug Reaction Relations from Unstructured Discharge Summaries in Singapore.
基於變壓器的大型語言模型在新加坡從非結構化出院摘要中識別不良藥物反應關係的有效性。 Drug Saf 2025-02-21

基於變壓器的語言模型在自然語言處理上有顯著進展，但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中，九個預訓練的模型在5,088對藥物-AE數據上微調，並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示，BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測，假陽性減少，精確度提升。整體而言，這些模型在識別因果相關藥物-AE對方面表現優於傳統方法，但仍需額外規則以克服限制。 PubMed DOI

An Evaluation Benchmark for Adverse Drug Event Prediction from Clinical Trial Results.
從臨床試驗結果預測不良藥物事件的評估基準。 Sci Data 2025-03-12

不良藥物事件（ADEs）在臨床試驗中是一大安全挑戰，因此預測這些事件對於開發更安全的藥物至關重要。我們推出了CT-ADE數據集，專注於單一藥物治療中的多標籤ADE預測，包含2,497種藥物和168,984對藥物-ADE配對，數據來自臨床試驗結果，並使用MedDRA標註。CT-ADE整合了治療和目標人群數據，便於比較分析。使用大型語言模型進行分析，最佳模型達到56%的F1分數，顯示上下文信息對預測ADE的重要性，使CT-ADE成為藥物安全風險評估的寶貴資源。 PubMed DOI

Leveraging large language models to mimic domain expert labeling in unstructured text-based electronic healthcare records in non-english languages.
利用大型語言模型模擬非英語語言中無結構文本電子健康紀錄的領域專家標註。 BMC Med Inform Decis Mak 2025-04-01

大數據與人工智慧在醫療保健中結合，特別是透過電子健康紀錄（EHR）的分析，能顯著提升診斷準確性。然而，處理大量非結構化數據是一大挑戰。本研究探討大型語言模型（LLMs）在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例，經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率，顯著優於預訓練模型的78.54%。結果顯示，微調的LLMs能高效分類非結構化EHR數據，提升醫療數據處理的效率與可靠性。 PubMed DOI

Using Large Language Models for Advanced and Flexible Labelling of Protocol Deviations in Clinical Development.
在臨床開發中運用大型語言模型進行先進且彈性的試驗偏差標註 Ther Innov Regul Sci 2025-05-13

臨床試驗中，方案偏差（PDs）定義不一，難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型，開發自動化系統，能快速分類Roche系統裡的PDs，自動標記出超過八成可能影響結果的PDs，讓專家能聚焦審查，大幅提升效率，幾分鐘就能得到有用見解。 PubMed DOI

Leveraging Data Pipeline and LLM to Advance Patient Safety Event Studies.
運用資料流程與LLM以促進病人安全事件研究 Stud Health Technol Inform 2025-05-17

這個專案用標準化流程和大型語言模型來分析MAUDE資料庫裡醫療器材報告的自由敘述，提升事件分類的準確率和效率。以內視鏡黏膜切除術為例，這方法也能應用到其他醫材。不過，若要做更全面的病人安全研究，還需要更多元且大量的報告樣本。 PubMed DOI

Leveraging Large Language Models for Synthetic Data Generation to Enhance Adverse Drug Event Detection in Tweets.
運用大型語言模型生成合成數據以提升推特中不良藥物事件偵測能力 Stud Health Technol Inform 2025-05-17

這篇論文用大型語言模型產生了1.7萬則帶有不良藥物事件標註的合成推文，解決社群媒體上缺乏標註資料的問題。用這些資料預訓練的NER模型，在真實推文上表現更好，經人工標註資料微調後更創新高，證明合成資料能大幅提升ADE偵測效果，且資料集已公開。 PubMed DOI

Detecting Adverse Drug Events in Clinical Notes Using Large Language Models.
使用大型語言模型偵測臨床紀錄中的藥物不良事件 Stud Health Technol Inform 2025-05-17

在電子病歷中找出藥物不良事件（ADEs）很困難，因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時，所以需要自動化工具。這項研究用大型語言模型來偵測ADEs，發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯，顯示通報機制還有很大改進空間。 PubMed DOI

Can large language models detect drug-drug interactions leading to adverse drug reactions?
大型語言模型能否偵測導致不良藥物反應的藥物間交互作用？ Ther Adv Drug Saf 2025-05-19

這項研究發現，ChatGPT 和 Claude 在協助藥物安全專家偵測藥物交互作用（DDIs）方面表現相近，且都優於 Gemini，尤其在簡單案例中。不過，三款大型語言模型的特異性都不高，容易誤判沒有交互作用的情況。總結來說，LLMs 可作為輔助工具，但專業藥師仍不可或缺，特別是在排除不存在的 DDIs 時。 PubMed DOI

原始文章

站上相關主題文章列表