原始文章

這項研究探討大型語言模型(LLMs)在識別接受免疫檢查點抑制劑(ICI)治療患者的免疫相關不良事件(irAEs)中的應用,並與傳統手動裁定及ICD代碼進行比較。研究分析了超過12年的住院紀錄,發現LLMs在檢測irAEs的敏感性顯著高於ICD代碼,且效率更佳,平均每份病歷僅需9.53秒。總體來說,LLMs被認為是檢測irAEs的有效工具,提供更高的敏感性和效率。 PubMed DOI


站上相關主題文章列表

門診病歷中的藥物安全資訊很重要,但現有技術無法充分運用。UCSF BERT是新的臨床語言模型,可幫助辨識IBD患者接受非類固醇免疫抑制劑治療可能出現的嚴重不良事件。研究顯示UCSF BERT在928份IBD病歷中表現優異,提高了準確度和F1分數,對於辨識與藥物使用相關的住院事件有潛力。這項研究顯示大型語言模型如UCSF BERT對於改善藥物監視非常有幫助。 PubMed DOI

門診病歷裡的藥物安全資訊很重要,但現在還沒有充分運用在藥物監控上。UCSF-BERT模型被用來找出接受非類固醇免疫抑制劑治療的IBD患者可能發生的嚴重不良事件。這個模型在辨識藥物相關SAE方面表現很好,準確性和F1分數都很高。未來可以透過更多研究提升模型表現,並使用多中心數據和更新的語言模型架構進行評估。這研究顯示大型語言模型對提升藥物監視效能有潛力。 PubMed DOI

隨著人工智慧工具的普及,患者和醫療專業人員越來越依賴這些工具提供的醫療資訊。本研究評估了五個大型語言模型(LLaMA 1、PaLM 2、Claude-v1、GPT-3.5和GPT-4)在2044個腫瘤學相關問題上的表現。結果顯示,GPT-4在與人類基準比較中表現最佳,達到第50百分位以上。雖然GPT-4的準確率高達81.1%,但所有模型仍存在顯著錯誤率,顯示出持續評估這些AI工具的重要性,以確保其安全應用於臨床實踐。 PubMed DOI

哨兵系統是美國FDA用來監控藥物安全的重要工具,透過臨床數據來指導藥物標籤和安全通訊。然而,觀察性數據的可靠性常受到挑戰。最近,大型語言模型(LLMs)的進展為解決這些問題提供了新機會,能從電子健康紀錄中識別不良事件並支持流行病學研究。不過,LLMs的準確性依賴於有效的提示工程,且其基礎設施在醫療系統中並不普遍,可能影響數據分析的公平性。此外,LLMs可能產生不準確的信息,導致假陽性,影響監管評估。因此,雖然LLMs有潛力改善上市後監測,但仍需努力確保公平性和準確性。 PubMed DOI

本研究評估大型語言模型(LLM),特別是GPT-4,是否能有效分析介入放射學(IR)微波消融裝置的安全事件數據。研究收集了2011年至2023年的安全數據,並由人類審核者進行分類。GPT-4的分類準確率在訓練集達96.0%,驗證集86.4%,測試集87.3%。最終生成的摘要與人類解讀相似,顯示LLM在處理IR安全數據方面的潛力,成為臨床醫生的有用工具。 PubMed DOI

這項研究探討小型大型語言模型(sLLM)在從病理報告中提取關鍵資訊的效果。使用三個版本的Llama 2模型,參數從70億到700億不等,並在零樣本和五樣本學習情境下進行評估。結果顯示,700億參數的模型在五樣本情境下表現優異,顯示sLLM能有效提升數據提取的效率與準確性。研究強調範例學習的重要性,並討論模型大小、準確性及處理時間的權衡,支持在臨床環境中應用先進語言模型,以改善病人護理和生物醫學研究。 PubMed DOI

藥物引起的肝損傷(DILI)是藥物安全性的重要議題,也是急性肝衰竭的主要原因。傳統的文獻搜尋方法因藥物相互作用的複雜性而效率不高,且手動整理容易出錯。近期,利用大型語言模型(LLMs)如LLaMA-2,研究人員開發了專門用於DILI分析的模型,並在CAMDA 2022的數據集上達到97.19%的準確率,顯示出LLMs在文獻識別上的潛力,可能簡化監管審查流程。 PubMed DOI

大型語言模型(LLMs),如OpenAI的GPT系列,在醫學領域展現潛力,特別是在腫瘤學中。研究評估了LLM在分類化療引起的主觀毒性方面的能力,結果顯示LLM在一般毒性類別的準確率為85.7%,但在特定類別的準確率僅為64.6%。雖然LLM的表現與腫瘤科醫生相當,但特定類別的準確性仍需改進。未來研究應聚焦於真實病人的驗證及即時互動能力,並考量數據準確性和隱私等倫理問題。總體而言,LLMs有潛力提升病人護理質量與效率。 PubMed DOI

這項研究旨在提升從臨床筆記中提取與炎症性腸病(IBD)相關的病人報告結果(PROs),比較傳統自然語言處理(tNLP)和大型語言模型(LLMs)的效果。研究針對腹痛、腹瀉和糞便出血進行標註,並開發模型提取資訊。結果顯示,GPT-4在準確率上優於tNLP,尤其在外部驗證中表現穩定。研究強調LLMs在不同機構間的泛化能力,建議更廣泛應用這些工具以改善IBD的研究與病人護理。 PubMed DOI

不良藥物事件(ADEs)對住院率影響顯著,且與高發病率和死亡率相關。傳統的藥物安全監測依賴於不良事件報告系統,但社交媒體如X(前身為Twitter)提供了有價值的患者見解。本研究探討使用大型語言模型(LLMs)進行ADE分類,結果顯示RoBERTa-large模型表現最佳,F1指標達0.8,微調後的ChatGPT則為0.75。特徵分析顯示某些術語在識別ADE中至關重要,顯示LLMs在藥物安全監測中的潛力。 PubMed DOI