原始文章

藥物引起的肝損傷(DILI)是藥物安全性的重要議題,也是急性肝衰竭的主要原因。傳統的文獻搜尋方法因藥物相互作用的複雜性而效率不高,且手動整理容易出錯。近期,利用大型語言模型(LLMs)如LLaMA-2,研究人員開發了專門用於DILI分析的模型,並在CAMDA 2022的數據集上達到97.19%的準確率,顯示出LLMs在文獻識別上的潛力,可能簡化監管審查流程。 PubMed DOI


站上相關主題文章列表

LLMs如ChatGPT可幫助監管機構處理龐大文件,但需克服專有信息處理、定製功能及輸出透明度挑戰。askFDALabel框架專為FDA藥物標籤開發,包含語義搜索和問答/文本生成模組,支援全面查詢。此框架可使小型LLMs成本效益地執行監管應用,展示了LLMs如何支持監管機構運作。 PubMed DOI

LLMs在臨床試驗文件生成上有潛力。輝瑞挑戰使用LLMs自動化臨床試驗文件,尤其是為CSRs創建安全表摘要。評估顯示性能差異,特別是在事實準確性和寫作風格方面。團隊多使用GPT模型,改進方向包括表格輸入、上下文添加和微調。挑戰結果顯示LLMs在自動化CSRs中表格摘要有潛力,強調需優化人類輸入和持續研究。 PubMed DOI

在生物醫學領域,分析藥物相互作用對藥物發現至關重要。目前使用的人工智慧工具受限於編碼生物醫學功能和概念。LEDAP利用大型語言模型如ChatGPT,展現了預測藥物相關關聯的潛力。這些模型對自然語言有全面理解,在藥物開發分析中具潛力。LEDAP結合傳統機器學習方法,表現競爭性。這研究凸顯大型語言模型在藥物開發的重要潛力,為該領域帶來更多發展機會。 PubMed DOI

這項研究評估了三個大型語言模型(LLMs)—ChatGPT 4.0、Bard 和 LLaMa 在生成抗體藥物偶聯物(ADCs)相關眼部毒性資訊的表現。共提出22個問題,專家對模型的回答進行評分。結果顯示,ChatGPT的準確性得分為4.62,Bard為4.77,LLaMa為4.41,前兩者顯著高於LLaMa。在完整性方面,三者得分相近。整體而言,這些模型在眼科專業主題上表現良好,但ChatGPT和Bard的準確性較高。建議隨著研究進展,應重新評估這些模型的表現。 PubMed DOI

新藥開發和不良藥物反應檢測傳統上耗時且成本高,但隨著大規模醫療數據庫和大型語言模型的興起,藥物篩選變得更有效。本研究提出一個自動化高通量藥物篩選流程,具備多項優勢,包括估算藥物與疾病的關聯、整合藥物重新利用與監測、準確解析暴露時間等。研究分析了661萬名患者的數據,發現16,901對藥物-疾病組合顯著降低風險,11,089對則顯著增加風險,顯示出潛在的藥物重新利用和安全問題。這項研究展示了自然語言處理在藥物流行病學中的潛力。 PubMed DOI

大型語言模型(LLMs),如OpenAI的GPT系列,在醫學領域展現潛力,特別是在腫瘤學中。研究評估了LLM在分類化療引起的主觀毒性方面的能力,結果顯示LLM在一般毒性類別的準確率為85.7%,但在特定類別的準確率僅為64.6%。雖然LLM的表現與腫瘤科醫生相當,但特定類別的準確性仍需改進。未來研究應聚焦於真實病人的驗證及即時互動能力,並考量數據準確性和隱私等倫理問題。總體而言,LLMs有潛力提升病人護理質量與效率。 PubMed DOI

這項研究探討大型語言模型(LLMs)在識別接受免疫檢查點抑制劑(ICI)治療患者的免疫相關不良事件(irAEs)中的應用,並與傳統手動裁定及ICD代碼進行比較。研究分析了超過12年的住院紀錄,發現LLMs在檢測irAEs的敏感性顯著高於ICD代碼,且效率更佳,平均每份病歷僅需9.53秒。總體來說,LLMs被認為是檢測irAEs的有效工具,提供更高的敏感性和效率。 PubMed DOI

這項研究評估了大型語言模型(LLMs)在藥物審查中的表現,特別是劑量錯誤、藥物相互作用及基因組學建議的能力。研究測試了四個LLM,發現ChatGPT在劑量方案上表現良好,但對simvastatin的問題有例外。所有LLM都能識別warfarin的相互作用,但錯過metoprolol和verapamil的相互作用。Claude-Instant在治療監測上提供適當建議,而Gemini在基因組學上表現不錯。研究指出,LLM在藥物審查中有潛力,但整合進醫療系統對病人安全至關重要。 PubMed DOI

不良藥物事件(ADEs)對住院率影響顯著,且與高發病率和死亡率相關。傳統的藥物安全監測依賴於不良事件報告系統,但社交媒體如X(前身為Twitter)提供了有價值的患者見解。本研究探討使用大型語言模型(LLMs)進行ADE分類,結果顯示RoBERTa-large模型表現最佳,F1指標達0.8,微調後的ChatGPT則為0.75。特徵分析顯示某些術語在識別ADE中至關重要,顯示LLMs在藥物安全監測中的潛力。 PubMed DOI

這項研究介紹了一個開源流程,利用本地的大型語言模型(LLM)"Llama 2" 從臨床文本中提取定量數據,專注於識別失代償性肝硬化的特徵。研究在MIMIC IV數據集中測試500名患者的病歷,成功識別五個關鍵臨床特徵,敏感度達100%,特異度96%。此外,對其他病症的檢測也相當高,顯示出本地部署的LLM在提取臨床信息方面的有效性,且硬體需求低。 PubMed DOI