原始文章

這項研究專注於從文本中提取與COVID-19疫苗相關的不良事件資訊,對疫苗安全性監測至關重要。研究比較了大型語言模型(LLMs)和傳統深度學習模型的表現,並探討了模型集成的優勢。使用了VAERS、Twitter和Reddit的數據,識別疫苗、接種和不良事件等實體。多個模型經過微調,最佳集成結果顯示「疫苗」的F1分數為0.878,「接種」為0.930,「不良事件」為0.925,整體微平均F1分數為0.903。研究強調了微調和集成方法在提升性能上的重要性,推進了生物醫學領域的自然語言處理。 PubMed DOI


站上相關主題文章列表

LLMs如GPT-3.5透過VAERS數據,展現了辨識疫苗相關不良事件的潛力。研究專注於1990至2016年的案例,特別研究流感疫苗。經過調整的AE-GPT模型在提取不良事件方面表現良好,顯示LLMs在處理醫學數據和推進不良事件檢測任務上有潛力。 PubMed DOI

這項研究評估大型語言模型(LLMs)在社交媒體健康相關文本分類的表現,並比較了不同模型的效果。結果顯示,基於人類標註數據的模型如RoBERTa和BERTweet表現優於基於GPT-3.5和GPT-4的模型。雖然LLM可用於數據增強,但僅依賴LLM標註數據訓練效果不佳。研究指出,LLM作為零樣本分類器能有效減少假陰性,並減輕手動標註負擔,顯示其在特定領域自然語言處理的潛力。 PubMed DOI

這項研究比較了微調深度學習模型(基於PubMed摘要)與大型語言模型(ChatGPT-3.5)在不良藥物事件命名實體識別(NER)的表現。結果顯示,Hussain等人的微調模型達到97.6%的F1分數,遠高於ChatGPT-3.5的86.0%。雖然少量學習在數據有限時仍具實用性,但無法超越深度學習模型的表現。未來將探討使用GPT-4的少量提示及微調GPT-3.5的可能性。 PubMed DOI

不良藥物事件(ADEs)對住院率影響顯著,且與高發病率和死亡率相關。傳統的藥物安全監測依賴於不良事件報告系統,但社交媒體如X(前身為Twitter)提供了有價值的患者見解。本研究探討使用大型語言模型(LLMs)進行ADE分類,結果顯示RoBERTa-large模型表現最佳,F1指標達0.8,微調後的ChatGPT則為0.75。特徵分析顯示某些術語在識別ADE中至關重要,顯示LLMs在藥物安全監測中的潛力。 PubMed DOI

這篇論文探討大型語言模型(LLMs)和提示工程如何在社交媒體上提取疫苗反應的見解,特別針對Reddit上有關帶狀皰疹(zoster)疫苗的討論。研究比較了GPT-3.5和GPT-4在不同提示策略下的表現,發現精心設計的思考鏈提示能提升模型識別相關帖文的能力。雖然少樣本學習對邊緣案例有改善,但精確度較低。輕量級的監督預訓練語言模型(PLMs)在分類任務中表現更佳,但LLMs在減少假陰性方面顯示潛力,特別是在數據有限時可作為分類器使用。 PubMed DOI

這項研究探討大型語言模型(LLMs)在分析社交媒體貼文,評估公眾對疫苗接種態度的應用。研究人員比較了不同LLMs的表現,包括GPT模型和開源替代品,並與基於規則的情感分析工具進行對比。結果顯示,使用表現最佳的LLMs進行少量提示能獲得最佳效果,而其他方法則有較高的誤分類風險。研究強調LLMs在公共衛生領域的潛力,建議將其納入公共衛生監測,以提升對健康政策公眾意見的評估能力。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在從電子健康紀錄中提取數據的表現,使用了50份合成醫療筆記。共測試了18個LLM,並與基準模型RoBERTa比較,涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等,準確率超過0.98,明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性,顯示出能有效協助數據提取,減輕醫療人員的負擔。不過,仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

基於變壓器的語言模型在自然語言處理上有顯著進展,但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中,九個預訓練的模型在5,088對藥物-AE數據上微調,並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示,BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測,假陽性減少,精確度提升。整體而言,這些模型在識別因果相關藥物-AE對方面表現優於傳統方法,但仍需額外規則以克服限制。 PubMed DOI

這項研究探討了從電子病歷中檢測肺栓塞不良事件的挑戰,並開發了一個利用大型語言模型的框架。研究回顧了2017至2022年間的病歷,發現40例肺栓塞不良事件,流行率為0.4%。框架包含證據提取、出院資訊提取和PEAE檢測三個模組,評估了四個開源模型,結果顯示高敏感性和特異性。研究強調關鍵字過濾和出院摘要的納入能改善性能,並建議未來應加強上下文理解和醫學術語解釋,以提升檢測能力。 PubMed DOI

這項研究探討COVID-19疫苗與不良事件的關聯,數據來自疫苗不良事件報告系統(VAERS)及社交媒體如Twitter和Reddit。分析了771對關聯,識別不同疫苗接種後的不良事件模式。使用了先進模型如GPT-3.5、GPT-4等進行關聯提取,並透過後處理規則精煉結果。經微調的GPT-3.5達到0.94的精確度和1的召回率。主要疫苗接種後常見的不良事件有手臂酸痛、疲勞和頭痛,而加強針則報告了更多不良事件,顯示大型語言模型在疫苗安全監測中的潛力。 PubMed DOI