原始文章

這項研究專注於從非結構化的臨床筆記中提取與腫瘤學相關的結構化資訊,特別是癌症藥物與症狀負擔的關係。研究人員建立了名為CACER的資料集,包含超過48,000個醫療問題和藥物事件的詳細註解。經過微調的BERT和Llama3模型在事件提取上表現最佳,F1分數分別為88.2和88.0,而GPT-4在這些任務中的表現最差。這顯示微調模型在特定任務上更有效,CACER資料庫為未來的醫療資訊提取研究提供了重要資源。 PubMed DOI


站上相關主題文章列表

這項研究評估了大型語言模型(LLMs),特別是GPT-3.5和GPT-4,在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告,結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生,達到96.8%。雖然醫生在精確度上稍勝一籌,但GPT-4的表現更一致,且能推斷出非明確的共病情況。整體而言,這些模型在提取資訊方面顯示出潛力,可能成為數據挖掘的重要工具。 PubMed DOI

這項研究評估了多種大型語言模型(LLMs)在從電子健康紀錄中提取數據的表現,使用了50份合成醫療筆記。共測試了18個LLM,並與基準模型RoBERTa比較,涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等,準確率超過0.98,明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性,顯示出能有效協助數據提取,減輕醫療人員的負擔。不過,仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

病人衍生癌症模型(PDCMs)在癌症研究中越來越重要,相關文獻在過去十年顯著增加。本研究探討大型語言模型(LLMs)在自動提取與PDCM相關的科學文本實體的應用,評估了直接提示和軟提示兩種方法。研究使用了先進的LLMs,包括GPT4-o和LLaMA3系列的開放模型。結果顯示,雖然GPT4-o在直接提示下表現不錯,但軟提示顯著提升了較小開放模型的性能,使其結果可與專有模型媲美。本研究強調了LLMs在專業文本提取中的有效性,以及根據任務和模型類型調整方法的重要性。 PubMed DOI

基於變壓器的語言模型在自然語言處理上有顯著進展,但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中,九個預訓練的模型在5,088對藥物-AE數據上微調,並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示,BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測,假陽性減少,精確度提升。整體而言,這些模型在識別因果相關藥物-AE對方面表現優於傳統方法,但仍需額外規則以克服限制。 PubMed DOI

這項研究評估了現代自然語言處理技術,特別是大型語言模型在電子健康紀錄中提取「適應症」資訊的能力,針對抗生素處方進行分析。研究分析了938,150份處方,將4,000個常見適應症分類為11個感染相關類別。結果顯示,微調的Bio+Clinical BERT模型在測試中表現優異,F1分數達0.97和0.98,明顯優於傳統方法。研究結論指出,自由文本適應症能更有效識別感染來源,提升31%。整體而言,基於變壓器的模型在提取臨床數據中顯示出廣泛應用潛力。 PubMed DOI

這篇回顧探討大型語言模型(LLMs)在腫瘤學中自動提取非結構化臨床文本的應用,強調其在提升癌症研究和病人照護的潛力。回顧分析了自2000年以來的24項研究,發現大多數使用BERT變體,少數使用Chat-GPT。研究顯示,LLMs能有效提取數據,減少醫療人員的手動工作量,並建議可減輕行政負擔,讓醫護人員更專注於病人照護。未來需進一步研究其在臨床實踐中的整合及表現。 PubMed DOI

這項研究探討大型語言模型(LLMs),如GPT-3.5、GPT-4.0和Claude-opus,在化學與疾病關係提取中的挑戰,特別是標註數據不足的情況。研究發現,這些模型在精確提取上達87%的F1分數,但全面提取僅73%。模型在提示工程上的改進有限,且對正向關係的識別較佳。提取錯誤多因模型誤解生物醫學文本的隱含意義。最後,研究提供了增強提取任務的工作流程,並強調優化訓練數據的重要性。 PubMed DOI

大型語言模型(LLMs)如BERT和GPT在2021至2023年間對臨床癌症護理的影響顯著。這篇回顧探討了LLMs在臨床決策支持、癌症教育和研究中的應用。LLMs可用於治療計畫、篩檢、管理治療反應及處理不良事件,並在癌症教育中協助問答和簡化資訊。在研究方面,LLMs幫助科學寫作和數據處理。研究顯示,LLMs在提升癌症護理上具潛力,未來應納入用戶反饋及開發開源工具。 PubMed DOI

本研究探討了深度學習模型在預測晚期上皮性卵巢癌患者手術結果的有效性,特別是使用非結構化的手術筆記。評估了RoBERTa和GatorTron兩個模型,結果顯示GatorTron在大多數任務中表現優於RoBERTa,顯示專為醫療設計的模型在理解醫療語言上有明顯優勢。不過,兩者在預測術後併發症和住院時間時仍面臨挑戰,顯示手術文本不足以全面反映術後恢復的複雜性。這些發現對提升患者護理質量的醫療AI系統發展至關重要。 PubMed DOI

研究發現,GPT-4在從乳癌和胰臟癌病歷中擷取腫瘤特徵及用藥資訊表現最佳,但遇到複雜推理時仍會出錯或資訊不完整。雖然大型語言模型有潛力協助臨床資料整理,但目前準確度還不夠,未來還需改進才能真正應用在臨床研究和照護上。 PubMed DOI