The Transformative Potential of Large Language Models in Mining Electronic Health Records Data: Content Analysis.
大型語言模型在挖掘電子健康紀錄數據中的變革潛力：內容分析。 JMIR Med Inform 2025-01-02

這項研究評估了大型語言模型（LLMs），特別是GPT-3.5和GPT-4，在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告，結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生，達到96.8%。雖然醫生在精確度上稍勝一籌，但GPT-4的表現更一致，且能推斷出非明確的共病情況。整體而言，這些模型在提取資訊方面顯示出潛力，可能成為數據挖掘的重要工具。 PubMed DOI

Large language models for data extraction from unstructured and semi-structured electronic health records: a multiple model performance evaluation.
從非結構化和半結構化電子健康紀錄中提取數據的大型語言模型：多模型性能評估。 BMJ Health Care Inform 2025-01-20

這項研究評估了多種大型語言模型（LLMs）在從電子健康紀錄中提取數據的表現，使用了50份合成醫療筆記。共測試了18個LLM，並與基準模型RoBERTa比較，涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等，準確率超過0.98，明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性，顯示出能有效協助數據提取，減輕醫療人員的負擔。不過，仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

Extracting Knowledge from Scientific Texts on Patient-Derived Cancer Models Using Large Language Models: Algorithm Development and Validation.
利用大型語言模型從患者衍生的癌症模型科學文本中提取知識：演算法開發與驗證。 bioRxiv 2025-02-20

病人衍生癌症模型（PDCMs）在癌症研究中越來越重要，相關文獻在過去十年顯著增加。本研究探討大型語言模型（LLMs）在自動提取與PDCM相關的科學文本實體的應用，評估了直接提示和軟提示兩種方法。研究使用了先進的LLMs，包括GPT4-o和LLaMA3系列的開放模型。結果顯示，雖然GPT4-o在直接提示下表現不錯，但軟提示顯著提升了較小開放模型的性能，使其結果可與專有模型媲美。本研究強調了LLMs在專業文本提取中的有效性，以及根據任務和模型類型調整方法的重要性。 PubMed DOI

Effectiveness of Transformer-Based Large Language Models in Identifying Adverse Drug Reaction Relations from Unstructured Discharge Summaries in Singapore.
基於變壓器的大型語言模型在新加坡從非結構化出院摘要中識別不良藥物反應關係的有效性。 Drug Saf 2025-02-21

基於變壓器的語言模型在自然語言處理上有顯著進展，但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中，九個預訓練的模型在5,088對藥物-AE數據上微調，並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示，BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測，假陽性減少，精確度提升。整體而言，這些模型在識別因果相關藥物-AE對方面表現優於傳統方法，但仍需額外規則以克服限制。 PubMed DOI

Transformers and large language models are efficient feature extractors for electronic health record studies.
變壓器和大型語言模型是電子健康紀錄研究中高效的特徵提取器。 Commun Med (Lond) 2025-03-22

這項研究評估了現代自然語言處理技術，特別是大型語言模型在電子健康紀錄中提取「適應症」資訊的能力，針對抗生素處方進行分析。研究分析了938,150份處方，將4,000個常見適應症分類為11個感染相關類別。結果顯示，微調的Bio+Clinical BERT模型在測試中表現優異，F1分數達0.97和0.98，明顯優於傳統方法。研究結論指出，自由文本適應症能更有效識別感染來源，提升31%。整體而言，基於變壓器的模型在提取臨床數據中顯示出廣泛應用潛力。 PubMed DOI

Large Language Model Applications for Health Information Extraction in Oncology: Scoping Review.
腫瘤學中健康信息提取的大型語言模型應用：範疇回顧。 JMIR Cancer 2025-03-28

這篇回顧探討大型語言模型（LLMs）在腫瘤學中自動提取非結構化臨床文本的應用，強調其在提升癌症研究和病人照護的潛力。回顧分析了自2000年以來的24項研究，發現大多數使用BERT變體，少數使用Chat-GPT。研究顯示，LLMs能有效提取數據，減少醫療人員的手動工作量，並建議可減輕行政負擔，讓醫護人員更專注於病人照護。未來需進一步研究其在臨床實踐中的整合及表現。 PubMed DOI

Prompting large language models to extract chemical‒disease relation precisely and comprehensively at the document level: an evaluation study.
在文件層面精確且全面地引導大型語言模型提取化學‒疾病關係：一項評估研究。 PLoS One 2025-04-08

這項研究探討大型語言模型（LLMs），如GPT-3.5、GPT-4.0和Claude-opus，在化學與疾病關係提取中的挑戰，特別是標註數據不足的情況。研究發現，這些模型在精確提取上達87%的F1分數，但全面提取僅73%。模型在提示工程上的改進有限，且對正向關係的識別較佳。提取錯誤多因模型誤解生物醫學文本的隱含意義。最後，研究提供了增強提取任務的工作流程，並強調優化訓練數據的重要性。 PubMed DOI

A Narrative Review on the Application of Large Language Models to Support Cancer Care and Research.
大型語言模型在癌症護理和研究中的應用敘述性回顧。 Yearb Med Inform 2025-04-08

大型語言模型（LLMs）如BERT和GPT在2021至2023年間對臨床癌症護理的影響顯著。這篇回顧探討了LLMs在臨床決策支持、癌症教育和研究中的應用。LLMs可用於治療計畫、篩檢、管理治療反應及處理不良事件，並在癌症教育中協助問答和簡化資訊。在研究方面，LLMs幫助科學寫作和數據處理。研究顯示，LLMs在提升癌症護理上具潛力，未來應納入用戶反饋及開發開源工具。 PubMed DOI

Mapping the Advanced-Stage Epithelial Ovarian Cancer Landscape Goes Beyond Words: Two Large Language Models, Eight Tasks, One Journey.
超越文字的晚期上皮卵巢癌景觀映射：兩個大型語言模型，八個任務，一段旅程。 J Clin Med 2025-04-12

本研究探討了深度學習模型在預測晚期上皮性卵巢癌患者手術結果的有效性，特別是使用非結構化的手術筆記。評估了RoBERTa和GatorTron兩個模型，結果顯示GatorTron在大多數任務中表現優於RoBERTa，顯示專為醫療設計的模型在理解醫療語言上有明顯優勢。不過，兩者在預測術後併發症和住院時間時仍面臨挑戰，顯示手術文本不足以全面反映術後恢復的複雜性。這些發現對提升患者護理質量的醫療AI系統發展至關重要。 PubMed DOI

CORAL: Expert-Curated Oncology Reports to Advance Language Model Inference.
CORAL：專家策劃的腫瘤學報告以促進語言模型推論 NEJM AI 2025-04-21

研究發現，GPT-4在從乳癌和胰臟癌病歷中擷取腫瘤特徵及用藥資訊表現最佳，但遇到複雜推理時仍會出錯或資訊不完整。雖然大型語言模型有潛力協助臨床資料整理，但目前準確度還不夠，未來還需改進才能真正應用在臨床研究和照護上。 PubMed DOI

原始文章

站上相關主題文章列表