The Transformative Potential of Large Language Models in Mining Electronic Health Records Data: Content Analysis.
大型語言模型在挖掘電子健康紀錄數據中的變革潛力：內容分析。 JMIR Med Inform 2025-01-02

這項研究評估了大型語言模型（LLMs），特別是GPT-3.5和GPT-4，在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告，結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生，達到96.8%。雖然醫生在精確度上稍勝一籌，但GPT-4的表現更一致，且能推斷出非明確的共病情況。整體而言，這些模型在提取資訊方面顯示出潛力，可能成為數據挖掘的重要工具。 PubMed DOI

Large language models for data extraction from unstructured and semi-structured electronic health records: a multiple model performance evaluation.
從非結構化和半結構化電子健康紀錄中提取數據的大型語言模型：多模型性能評估。 BMJ Health Care Inform 2025-01-20

這項研究評估了多種大型語言模型（LLMs）在從電子健康紀錄中提取數據的表現，使用了50份合成醫療筆記。共測試了18個LLM，並與基準模型RoBERTa比較，涵蓋多個任務。表現最佳的模型包括Claude 3.0 Opus、GPT 4等，準確率超過0.98，明顯優於RoBERTa的0.742。這些模型在多次測試中也展現出一致性，顯示出能有效協助數據提取，減輕醫療人員的負擔。不過，仍需用真實數據進一步驗證其實際應用效果。 PubMed DOI

Scalable information extraction from free text electronic health records using large language models.
使用大型語言模型從自由文本電子健康紀錄中進行可擴展的信息提取。 BMC Med Res Methodol 2025-01-28

這項研究探討開源大型語言模型（LLMs）在從電子健康紀錄（EHRs）中提取社會健康決定因素（SDoH）數據的效果。研究隨機選取200名患者，並由兩位審查者手動標記九個SDoH方面，達成93%的高一致性。結果顯示，LLMs的表現明顯優於基準模型，特別是在識別明確提及的SDoH方面。最佳模型openchat_3.5在所有SDoH方面的準確率最高。研究強調進一步精煉和專業訓練的潛力，以提升LLMs在臨床研究中的應用，最終改善醫療結果。 PubMed DOI

Large Language Models Outperform Traditional Natural Language Processing Methods in Extracting Patient-Reported Outcomes in Inflammatory Bowel Disease.
大型語言模型在提取炎症性腸病患者報告結果方面優於傳統自然語言處理方法。 Gastro Hep Adv 2025-01-29

這項研究探討如何從電子健康紀錄中提取與炎症性腸病（IBD）相關的病人報告結果（PROs），比較了傳統自然語言處理（tNLP）和大型語言模型（LLMs）如GPT-4的表現。研究發現，GPT-4在提取腹痛、腹瀉和糞便血的準確率上均優於tNLP，特別是在外部驗證中保持高準確率。這顯示LLMs在IBD研究和病人護理中具有良好的應用潛力，且不受人口統計或診斷偏見影響。 PubMed DOI

Effectiveness of Transformer-Based Large Language Models in Identifying Adverse Drug Reaction Relations from Unstructured Discharge Summaries in Singapore.
基於變壓器的大型語言模型在新加坡從非結構化出院摘要中識別不良藥物反應關係的有效性。 Drug Saf 2025-02-21

基於變壓器的語言模型在自然語言處理上有顯著進展，但在臨床環境中識別藥物不良事件的有效性受到非標準語言的挑戰。研究中，九個預訓練的模型在5,088對藥物-AE數據上微調，並在新加坡的去識別化出院摘要及MIMIC-III數據庫進行驗證。結果顯示，BioM-ELECTRA-Large-BiLSTM模型的F1分數比傳統機器學習提高了16.1%。透過應用規則精煉預測，假陽性減少，精確度提升。整體而言，這些模型在識別因果相關藥物-AE對方面表現優於傳統方法，但仍需額外規則以克服限制。 PubMed DOI

Information Extraction from Clinical Texts with Generative Pre-trained Transformer Models.
使用生成預訓練變壓器模型從臨床文本中提取信息。 Int J Med Sci 2025-03-03

本研究評估了GPT-3.5和GPT-4在從非結構化臨床文本中提取資訊的效果。使用了病人特徵、病史和臨床檢測結果的資料，並透過簡單提示進行查詢。結果顯示，GPT-4在性別資訊提取上準確率達95%，優於GPT-3.5的70%；但在身體質量指數（BMI）方面，GPT-3.5的78%表現更佳。研究建議整合特定任務的定義進入提示中，以提升提取效果，並鼓勵專業人士設計有效提示，監控大型語言模型的表現。 PubMed DOI

Comparing Large Language Models for antibiotic prescribing in different clinical scenarios: which perform better?
比較大型語言模型在不同臨床情境下的抗生素處方：哪一種表現更佳？ Clin Microbiol Infect 2025-03-20

這項研究評估了十四個大型語言模型（LLMs）在不同臨床情境中推薦抗生素的表現。研究使用標準化提示，針對60個案例的藥物選擇、劑量和治療持續時間進行評估。結果顯示，ChatGPT-o1的準確率最高，達71.7%，劑量正確性達96.7%。而在治療持續時間方面，Gemini表現最佳（75.0%）。不過，各模型在複雜案例中的表現差異明顯，顯示出在臨床應用前仍需謹慎驗證。 PubMed DOI

Leveraging large language models to mimic domain expert labeling in unstructured text-based electronic healthcare records in non-english languages.
利用大型語言模型模擬非英語語言中無結構文本電子健康紀錄的領域專家標註。 BMC Med Inform Decis Mak 2025-04-01

大數據與人工智慧在醫療保健中結合，特別是透過電子健康紀錄（EHR）的分析，能顯著提升診斷準確性。然而，處理大量非結構化數據是一大挑戰。本研究探討大型語言模型（LLMs）在分類含排版錯誤的EHR文本的有效性。研究以哈哲特佩大學的兒科急診室數據為例，經微調的GPT-3模型在識別呼吸道感染病例上達到99.88%準確率，顯著優於預訓練模型的78.54%。結果顯示，微調的LLMs能高效分類非結構化EHR數據，提升醫療數據處理的效率與可靠性。 PubMed DOI

A Large Language Model Outperforms Other Computational Approaches to the High-Throughput Phenotyping of Physician Notes.
大型語言模型在醫師筆記高通量表現型分析中優於其他計算方法 AMIA Annu Symp Proc 2025-05-26

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現，GPT-4表現最好，顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具，有助於推動精準醫療發展。 PubMed

Using large language models to extract information from pediatric clinical reports.
利用大型語言模型從兒科臨床報告中擷取資訊 PLOS Digit Health 2025-07-23

大部分醫療紀錄都是非結構化，讓資料分析很困難。這項研究測試九種大型語言模型，能自動從兒科臨床報告擷取結構化資料。不論是商業還是開源模型，表現都很優秀，最好的模型辨識重要病患資訊的準確率超過九成。LLMs為醫療資料擷取提供靈活又準確的替代方案，有機會取代人工處理。 PubMed DOI

原始文章

站上相關主題文章列表