原始文章

這項研究探討稀疏自編碼器(SAEs)在生物醫學,特別是針對不良藥物反應(ADRs)的應用。研究人員將Gemma2-9b-it模型中的藥物名稱隱藏狀態嵌入轉換為可解釋的特徵,並訓練線性分類器預測ADRs的可能性。結果顯示,對急性腎損傷和腸胃道出血等情況的預測表現良好,AUC-ROC分數高。SAE輸出的線性分類器表現與原始嵌入的神經網絡相當,顯示SAEs能有效保留重要資訊並簡化模型,增強解釋性,適用於藥物監測等生物醫學應用。 PubMed DOI


站上相關主題文章列表

在生物醫學領域,分析藥物相互作用對藥物發現至關重要。目前使用的人工智慧工具受限於編碼生物醫學功能和概念。LEDAP利用大型語言模型如ChatGPT,展現了預測藥物相關關聯的潛力。這些模型對自然語言有全面理解,在藥物開發分析中具潛力。LEDAP結合傳統機器學習方法,表現競爭性。這研究凸顯大型語言模型在藥物開發的重要潛力,為該領域帶來更多發展機會。 PubMed DOI

新藥開發和不良藥物反應檢測傳統上耗時且成本高,但隨著大規模醫療數據庫和大型語言模型的興起,藥物篩選變得更有效。本研究提出一個自動化高通量藥物篩選流程,具備多項優勢,包括估算藥物與疾病的關聯、整合藥物重新利用與監測、準確解析暴露時間等。研究分析了661萬名患者的數據,發現16,901對藥物-疾病組合顯著降低風險,11,089對則顯著增加風險,顯示出潛在的藥物重新利用和安全問題。這項研究展示了自然語言處理在藥物流行病學中的潛力。 PubMed DOI

藥物引起的肝損傷(DILI)是藥物安全性的重要議題,也是急性肝衰竭的主要原因。傳統的文獻搜尋方法因藥物相互作用的複雜性而效率不高,且手動整理容易出錯。近期,利用大型語言模型(LLMs)如LLaMA-2,研究人員開發了專門用於DILI分析的模型,並在CAMDA 2022的數據集上達到97.19%的準確率,顯示出LLMs在文獻識別上的潛力,可能簡化監管審查流程。 PubMed DOI

不良藥物事件(ADEs)對住院率影響顯著,且與高發病率和死亡率相關。傳統的藥物安全監測依賴於不良事件報告系統,但社交媒體如X(前身為Twitter)提供了有價值的患者見解。本研究探討使用大型語言模型(LLMs)進行ADE分類,結果顯示RoBERTa-large模型表現最佳,F1指標達0.8,微調後的ChatGPT則為0.75。特徵分析顯示某些術語在識別ADE中至關重要,顯示LLMs在藥物安全監測中的潛力。 PubMed DOI

這項研究探討如何利用大型語言模型(LLMs)來提升計算藥物重定位的能力,特別是預測藥物與疾病的關聯。傳統方法常受限於不完整的數據,而LLMs能提供豐富的生物醫學知識。研究人員開發了零樣本提示模板,並提出三種模型架構,結果顯示LLM-DDA<sub>GNN-AE</sub>在多項指標上表現優於其他模型。案例研究也證實了該模型在識別可靠藥物與疾病關聯方面的能力,顯示LLMs在藥物重定位及其他生物醫學任務中的潛力。 PubMed DOI

藥物基因組學(PGx)旨在根據個人基因特徵來個性化醫療,以提升藥物療效與安全性。不過,PGx 研究面臨數據分散和提取繁瑣的挑戰。本研究評估大型語言模型(LLMs),特別是 Llama3.1-70B,能否自動化從 FDA 藥物標籤中提取 PGx 資訊。結果顯示,該模型在識別藥物-生物標記對的準確率達 91.4%,並且在提取 PGx 類別的穩定性超過 85%。這不僅簡化了數據提取,還有助於改善個性化醫療,並為少數族群揭示新資訊,顯示 LLMs 在 PGx 研究中的潛力。 PubMed DOI

與藥物相關的不良事件(AEs)是重要的公共衛生議題,而FDA的藥物標籤文件對於藥物安全性研究至關重要。手動提取不良事件數據既耗時又需專業知識,難以跟上更新。為了解決這個問題,開發了名為AskFDALabel的自動化流程,利用大型語言模型(LLM)和檢索增強生成(RAG)技術。該系統在三個基準實驗中表現優異,DILI的F1分數達0.978,DICT為0.931,顯示出顯著提高不良事件註釋的效率與準確性,對藥物安全研究具有重要潛力。 PubMed DOI

基於變壓器的語言模型在自然語言處理上有顯著進展,但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中,九個預訓練的模型在5,088對藥物-AE數據上微調,並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示,BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測,假陽性減少,精確度提升。整體而言,這些模型在識別因果相關藥物-AE對方面表現優於傳統方法,但仍需額外規則以克服限制。 PubMed DOI

這項研究探討了從電子病歷中檢測肺栓塞不良事件的挑戰,並開發了一個利用大型語言模型的框架。研究回顧了2017至2022年間的病歷,發現40例肺栓塞不良事件,流行率為0.4%。框架包含證據提取、出院資訊提取和PEAE檢測三個模組,評估了四個開源模型,結果顯示高敏感性和特異性。研究強調關鍵字過濾和出院摘要的納入能改善性能,並建議未來應加強上下文理解和醫學術語解釋,以提升檢測能力。 PubMed DOI

機器學習(ML)和人工智慧(AI)在醫療領域的應用潛力巨大,但仍面臨解釋性和可靠性等挑戰。本文提出一種新方法,利用大型語言模型(LLMs)進行特徵工程,從《牛津醫學教科書》中提取臨床特徵,提升可解釋性。這種方法將臨床筆記轉換為概念向量,並使用線性分類器,準確率達到0.72,超越傳統基準。使用文本嵌入技術也顯著降低了時間和成本,減少了97%。相關代碼和補充材料可在指定網址獲得。 PubMed DOI