原始文章

這篇論文用大型語言模型產生了1.7萬則帶有不良藥物事件標註的合成推文,解決社群媒體上缺乏標註資料的問題。用這些資料預訓練的NER模型,在真實推文上表現更好,經人工標註資料微調後更創新高,證明合成資料能大幅提升ADE偵測效果,且資料集已公開。 PubMed DOI


站上相關主題文章列表

哨兵系統是美國FDA用來監控藥物安全的重要工具,透過臨床數據來指導藥物標籤和安全通訊。然而,觀察性數據的可靠性常受到挑戰。最近,大型語言模型(LLMs)的進展為解決這些問題提供了新機會,能從電子健康紀錄中識別不良事件並支持流行病學研究。不過,LLMs的準確性依賴於有效的提示工程,且其基礎設施在醫療系統中並不普遍,可能影響數據分析的公平性。此外,LLMs可能產生不準確的信息,導致假陽性,影響監管評估。因此,雖然LLMs有潛力改善上市後監測,但仍需努力確保公平性和準確性。 PubMed DOI

不良藥物事件(ADEs)對住院率影響顯著,且與高發病率和死亡率相關。傳統的藥物安全監測依賴於不良事件報告系統,但社交媒體如X(前身為Twitter)提供了有價值的患者見解。本研究探討使用大型語言模型(LLMs)進行ADE分類,結果顯示RoBERTa-large模型表現最佳,F1指標達0.8,微調後的ChatGPT則為0.75。特徵分析顯示某些術語在識別ADE中至關重要,顯示LLMs在藥物安全監測中的潛力。 PubMed DOI

隨著醫療保健對先進分析的需求增加,合成健康數據的使用變得愈加重要,尤其是在獲取真實健康數據的挑戰下。大型語言模型(LLMs)的進展為生成合成健康數據提供了新機會,但也帶來潛在風險。本文綜述了合成健康數據生成(SHDG)及LLM的研究,探討生成對抗網絡等機器學習模型的現狀與局限性。SHDG面臨的挑戰包括評估指標、數據效率、健康公平等,雖然LLMs在某些方面顯示潛力,但深入研究其優缺點仍然至關重要。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs),如BART和GPT-4,從MedHelp論壇的用戶評論中識別藥物停用事件(DDEs)。DDEs對藥物依從性和病人結果至關重要,但研究仍不多。研究人員建立了一個靈活的框架,並發布了首個開源DDE數據集,以促進後續研究。結果顯示,GPT-4o在識別根本原因上表現優異,而BART在檢測DDEs方面最有效。這項研究顯示了LLMs在分析公開數據的潛力,並鼓勵進一步探索。 PubMed DOI

這項研究專注於從文本中提取與COVID-19疫苗相關的不良事件資訊,對疫苗安全性監測至關重要。研究比較了大型語言模型(LLMs)和傳統深度學習模型的表現,並探討了模型集成的優勢。使用了VAERS、Twitter和Reddit的數據,識別疫苗、接種和不良事件等實體。多個模型經過微調,最佳集成結果顯示「疫苗」的F1分數為0.878,「接種」為0.930,「不良事件」為0.925,整體微平均F1分數為0.903。研究強調了微調和集成方法在提升性能上的重要性,推進了生物醫學領域的自然語言處理。 PubMed DOI

基於變壓器的語言模型在自然語言處理上有顯著進展,但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中,九個預訓練的模型在5,088對藥物-AE數據上微調,並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示,BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測,假陽性減少,精確度提升。整體而言,這些模型在識別因果相關藥物-AE對方面表現優於傳統方法,但仍需額外規則以克服限制。 PubMed DOI

這項研究針對低資源語言,特別是愛沙尼亞語,開發命名實體識別(NER)模型,目的是從醫療記錄中提取重要的醫療實體。由於缺乏標註數據,作者提出三步驟方法:首先,利用本地訓練的GPT-2生成合成醫療數據;接著,使用GPT-3.5-Turbo和GPT-4對這些數據進行標註;最後,微調NER模型並測試真實醫療文本。研究結果顯示,藥物提取的F<sub>1</sub>分數為0.69,程序提取為0.38,顯示出在藥物識別上的有效性,並指出程序提取的挑戰。這方法為未來在其他語言的研究提供了新方向。 PubMed DOI

在電子病歷中找出藥物不良事件(ADEs)很困難,因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時,所以需要自動化工具。這項研究用大型語言模型來偵測ADEs,發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯,顯示通報機制還有很大改進空間。 PubMed DOI

這項研究發現,ChatGPT 和 Claude 在協助藥物安全專家偵測藥物交互作用(DDIs)方面表現相近,且都優於 Gemini,尤其在簡單案例中。不過,三款大型語言模型的特異性都不高,容易誤判沒有交互作用的情況。總結來說,LLMs 可作為輔助工具,但專業藥師仍不可或缺,特別是在排除不存在的 DDIs 時。 PubMed DOI

這篇研究用標註過的出院摘要,建立大規模資料集,並用多種大型語言模型來偵測八種物質使用情形。經過微調的 Llama-DrugDetector-70B 模型,對大多數物質的偵測準確率很高(F1 分數 ≥ 0.95),但像鴉片類藥物和多重物質使用的偵測還有進步空間。整體來說,LLM 有助提升臨床紀錄中物質使用的辨識,但還需要更多研究才能廣泛應用。 PubMed DOI