AE-GPT: Using Large Language Models to extract adverse events from surveillance reports-A use case with influenza vaccine adverse events.
AE-GPT：使用大型語言模型從監測報告中提取不良事件-以流感疫苗不良事件為例。 PLoS One 2024-03-25

LLMs如GPT-3.5透過VAERS數據，展現了辨識疫苗相關不良事件的潛力。研究專注於1990至2016年的案例，特別研究流感疫苗。經過調整的AE-GPT模型在提取不良事件方面表現良好，顯示LLMs在處理醫學數據和推進不良事件檢測任務上有潛力。 PubMed DOI

Evaluating large language models for health-related text classification tasks with public social media data.
利用公共社交媒體數據評估大型語言模型在健康相關文本分類任務中的表現。 J Am Med Inform Assoc 2024-08-09

這項研究評估大型語言模型（LLMs）在社交媒體健康相關文本分類的表現，並比較了不同模型的效果。結果顯示，基於人類標註數據的模型如RoBERTa和BERTweet表現優於基於GPT-3.5和GPT-4的模型。雖然LLM可用於數據增強，但僅依賴LLM標註數據訓練效果不佳。研究指出，LLM作為零樣本分類器能有效減少假陰性，並減輕手動標註負擔，顯示其在特定領域自然語言處理的潛力。 PubMed DOI

Comparing a Large Language Model with Previous Deep Learning Models on Named Entity Recognition of Adverse Drug Events.
比較大型語言模型與先前深度學習模型在不良藥物事件命名實體識別上的表現。 Stud Health Technol Inform 2024-08-23

這項研究比較了微調深度學習模型（基於PubMed摘要）與大型語言模型（ChatGPT-3.5）在不良藥物事件命名實體識別（NER）的表現。結果顯示，Hussain等人的微調模型達到97.6%的F1分數，遠高於ChatGPT-3.5的86.0%。雖然少量學習在數據有限時仍具實用性，但無法超越深度學習模型的表現。未來將探討使用GPT-4的少量提示及微調GPT-3.5的可能性。 PubMed DOI

Developing large language models to detect adverse drug events in posts on x.
在 x 平台上開發大型語言模型以檢測不良藥物事件。 J Biopharm Stat 2024-09-20

不良藥物事件（ADEs）對住院率影響顯著，且與高發病率和死亡率相關。傳統的藥物安全監測依賴於不良事件報告系統，但社交媒體如X（前身為Twitter）提供了有價值的患者見解。本研究探討使用大型語言模型（LLMs）進行ADE分類，結果顯示RoBERTa-large模型表現最佳，F1指標達0.8，微調後的ChatGPT則為0.75。特徵分析顯示某些術語在識別ADE中至關重要，顯示LLMs在藥物安全監測中的潛力。 PubMed DOI

Exploring Large Language Models for Detecting Online Vaccine Reactions.
探索大型語言模型以檢測線上疫苗反應。 Stud Health Technol Inform 2024-09-25

這篇論文探討大型語言模型（LLMs）和提示工程如何在社交媒體上提取疫苗反應的見解，特別針對Reddit上有關帶狀皰疹（zoster）疫苗的討論。研究比較了GPT-3.5和GPT-4在不同提示策略下的表現，發現精心設計的思考鏈提示能提升模型識別相關帖文的能力。雖然少樣本學習對邊緣案例有改善，但精確度較低。輕量級的監督預訓練語言模型（PLMs）在分類任務中表現更佳，但LLMs在減少假陰性方面顯示潛力，特別是在數據有限時可作為分類器使用。 PubMed DOI

Use of large language models as a scalable approach to understanding public health discourse.
大型語言模型作為理解公共衛生話語的可擴展方法。 PLOS Digit Health 2024-10-16

這項研究探討大型語言模型（LLMs）在分析社交媒體貼文，評估公眾對疫苗接種態度的應用。研究人員比較了不同LLMs的表現，包括GPT模型和開源替代品，並與基於規則的情感分析工具進行對比。結果顯示，使用表現最佳的LLMs進行少量提示能獲得最佳效果，而其他方法則有較高的誤分類風險。研究強調LLMs在公共衛生領域的潛力，建議將其納入公共衛生監測，以提升對健康政策公眾意見的評估能力。 PubMed DOI

Large language models for data extraction from unstructured and semi-structured electronic health records: a multiple model performance evaluation.
從非結構化和半結構化電子健康紀錄中提取數據的大型語言模型：多模型性能評估。 BMJ Health Care Inform 2025-01-20

這項研究評估了多種大型語言模型（LLMs）在從電子健康紀錄中提取數據的表現，使用了50份合成醫療筆記。共測試了18個LLM，並與基準模型RoBERTa比較，涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等，準確率超過0.98，明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性，顯示出能有效協助數據提取，減輕醫療人員的負擔。不過，仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

Effectiveness of Transformer-Based Large Language Models in Identifying Adverse Drug Reaction Relations from Unstructured Discharge Summaries in Singapore.
基於變壓器的大型語言模型在新加坡從非結構化出院摘要中識別不良藥物反應關係的有效性。 Drug Saf 2025-02-21

基於變壓器的語言模型在自然語言處理上有顯著進展，但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中，九個預訓練的模型在5,088對藥物-AE數據上微調，並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示，BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測，假陽性減少，精確度提升。整體而言，這些模型在識別因果相關藥物-AE對方面表現優於傳統方法，但仍需額外規則以克服限制。 PubMed DOI

Utilizing large language models for detecting hospital-acquired conditions: an empirical study on pulmonary embolism.
利用大型語言模型檢測醫院獲得的病症：針對肺栓塞的實證研究。 J Am Med Inform Assoc 2025-03-19

這項研究探討了從電子病歷中檢測肺栓塞不良事件的挑戰，並開發了一個利用大型語言模型的框架。研究回顧了2017至2022年間的病歷，發現40例肺栓塞不良事件，流行率為0.4%。框架包含證據提取、出院資訊提取和PEAE檢測三個模組，評估了四個開源模型，結果顯示高敏感性和特異性。研究強調關鍵字過濾和出院摘要的納入能改善性能，並建議未來應加強上下文理解和醫學術語解釋，以提升檢測能力。 PubMed DOI

Enhancing Relation Extraction for COVID-19 Vaccine Shot-Adverse Event Associations with Large Language Models.
利用大型語言模型增強 COVID-19 疫苗接種與不良事件之間的關係提取。 Res Sq 2025-04-01

這項研究探討COVID-19疫苗與不良事件的關聯，數據來自疫苗不良事件報告系統（VAERS）及社交媒體如Twitter和Reddit。分析了771對關聯，識別不同疫苗接種後的不良事件模式。使用了先進模型如GPT-3.5、GPT-4等進行關聯提取，並透過後處理規則精煉結果。經微調的GPT-3.5達到0.94的精確度和1的召回率。主要疫苗接種後常見的不良事件有手臂酸痛、疲勞和頭痛，而加強針則報告了更多不良事件，顯示大型語言模型在疫苗安全監測中的潛力。 PubMed DOI

原始文章

站上相關主題文章列表