原始文章

這項研究評估了現代自然語言處理技術,特別是大型語言模型在電子健康紀錄中提取「適應症」資訊的能力,針對抗生素處方進行分析。研究分析了938,150份處方,將4,000個常見適應症分類為11個感染相關類別。結果顯示,微調的Bio+Clinical BERT模型在測試中表現優異,F1分數達0.97和0.98,明顯優於傳統方法。研究結論指出,自由文本適應症能更有效識別感染來源,提升31%。整體而言,基於變壓器的模型在提取臨床數據中顯示出廣泛應用潛力。 PubMed DOI


站上相關主題文章列表

這篇文章討論了自然語言處理(NLP)和大型語言模型(LLMs)在傳染病管理的應用,列舉了15個研究案例,像是利用GPT-4檢測尿路感染、BERTweet監測萊姆病。雖然這些模型展現了潛力,但效果有差異。未來需更深入研究,充分運用人工智慧在疾病診斷、監測、預測和追蹤傳染病管理的流行病學趨勢。 PubMed DOI

這項研究評估大型語言模型(LLMs)在社交媒體健康相關文本分類的表現,並比較了不同模型的效果。結果顯示,基於人類標註數據的模型如RoBERTa和BERTweet表現優於基於GPT-3.5和GPT-4的模型。雖然LLM可用於數據增強,但僅依賴LLM標註數據訓練效果不佳。研究指出,LLM作為零樣本分類器能有效減少假陰性,並減輕手動標註負擔,顯示其在特定領域自然語言處理的潛力。 PubMed DOI

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告,結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生,達到96.8%。雖然醫生在精確度上稍勝一籌,但GPT-4的表現更一致,且能推斷出非明確的共病情況。整體而言,這些模型在提取資訊方面顯示出潛力,可能成為數據挖掘的重要工具。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在從電子健康紀錄中提取數據的表現,使用了50份合成醫療筆記。共測試了18個LLM,並與基準模型RoBERTa比較,涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等,準確率超過0.98,明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性,顯示出能有效協助數據提取,減輕醫療人員的負擔。不過,仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

這項研究探討開源大型語言模型(LLMs)在從電子健康紀錄(EHRs)中提取社會健康決定因素(SDoH)數據的效果。研究隨機選取200名患者,並由兩位審查者手動標記九個SDoH方面,達成93%的高一致性。結果顯示,LLMs的表現明顯優於基準模型,特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力,以提升LLMs在臨床研究中的應用,最終改善醫療結果。 PubMed DOI

這項研究探討如何從電子健康紀錄中提取與炎症性腸病(IBD)相關的病人報告結果(PROs),比較了傳統自然語言處理(tNLP)和大型語言模型(LLMs)如GPT-4的表現。研究發現,GPT-4在提取腹痛、腹瀉和糞便血的準確率上均優於tNLP,特別是在外部驗證中保持高準確率。這顯示LLMs在IBD研究和病人護理中具有良好的應用潛力,且不受人口統計或診斷偏見影響。 PubMed DOI

基於變壓器的語言模型在自然語言處理上有顯著進展,但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中,九個預訓練的模型在5,088對藥物-AE數據上微調,並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示,BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測,假陽性減少,精確度提升。整體而言,這些模型在識別因果相關藥物-AE對方面表現優於傳統方法,但仍需額外規則以克服限制。 PubMed DOI

本研究評估了GPT-3.5和GPT-4在從非結構化臨床文本中提取資訊的效果。使用了病人特徵、病史和臨床檢測結果的資料,並透過簡單提示進行查詢。結果顯示,GPT-4在性別資訊提取上準確率達95%,優於GPT-3.5的70%;但在身體質量指數(BMI)方面,GPT-3.5的78%表現更佳。研究建議整合特定任務的定義進入提示中,以提升提取效果,並鼓勵專業人士設計有效提示,監控大型語言模型的表現。 PubMed DOI

這項研究評估了十四個大型語言模型(LLMs)在不同臨床情境中推薦抗生素的表現。研究使用標準化提示,針對60個案例的藥物選擇、劑量和治療持續時間進行評估。結果顯示,ChatGPT-o1的準確率最高,達71.7%,劑量正確性達96.7%。而在治療持續時間方面,Gemini表現最佳(75.0%)。不過,各模型在複雜案例中的表現差異明顯,顯示出在臨床應用前仍需謹慎驗證。 PubMed DOI

大數據與人工智慧在醫療保健中結合,特別是透過電子健康紀錄(EHR)的分析,能顯著提升診斷準確性。然而,處理大量非結構化數據是一大挑戰。本研究探討大型語言模型(LLMs)在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例,經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率,顯著優於預訓練模型的78.54%。結果顯示,微調的LLMs能高效分類非結構化EHR數據,提升醫療數據處理的效率與可靠性。 PubMed DOI