Accuracy of a Proprietary Large Language Model in Labeling Obstetric Incident Reports.
專有大型語言模型在標記產科事件報告中的準確性。 Jt Comm J Qual Patient Saf 2024-09-10

這項研究評估了GPT-3.5這種大型語言模型在自動標記產科事件報告的效果。分析了370份住院產科報告，並以人類標註作為金標準。結果顯示，該模型的敏感度達85.7%，特異度為97.9%，使用了79個標籤，而人類僅用了49個。模型的標籤解釋也有60.8%獲得審核者認可。總體來看，GPT-3.5能提升事件報告系統的數據利用效率，並可能改善病人安全。 PubMed DOI

Utilizing large language models for detecting hospital-acquired conditions: an empirical study on pulmonary embolism.
利用大型語言模型檢測醫院獲得的病症：針對肺栓塞的實證研究。 J Am Med Inform Assoc 2025-03-19

這項研究探討了從電子病歷中檢測肺栓塞不良事件的挑戰，並開發了一個利用大型語言模型的框架。研究回顧了2017至2022年間的病歷，發現40例肺栓塞不良事件，流行率為0.4%。框架包含證據提取、出院資訊提取和PEAE檢測三個模組，評估了四個開源模型，結果顯示高敏感性和特異性。研究強調關鍵字過濾和出院摘要的納入能改善性能，並建議未來應加強上下文理解和醫學術語解釋，以提升檢測能力。 PubMed DOI

Leveraging LLMs to Understand Narratives in Maude Reports.
利用大型語言模型 (LLMs) 理解 Maude 報告中的敘事。 Stud Health Technol Inform 2025-04-09

MAUDE資料庫追蹤醫療器材的不良事件，最近受到更多關注，但報告中的敘述常被忽略，導致重要見解流失。為了解決這個問題，我們使用大型語言模型（LLMs），特別是OpenAI的GPT-4-turbo，來分析內視鏡夾相關的MAUDE報告，識別未編碼的手術程序並提取額外見解。這種方法顯示LLMs在處理敘述數據上的有效性，提供比傳統分析更高效且具成本效益的替代方案，最終能將MAUDE報告轉化為臨床實踐的可行知識。 PubMed DOI

Using Large Language Models for Advanced and Flexible Labelling of Protocol Deviations in Clinical Development.
在臨床開發中運用大型語言模型進行先進且彈性的試驗偏差標註 Ther Innov Regul Sci 2025-05-13

臨床試驗中，方案偏差（PDs）定義不一，難以有效辨識關鍵影響。傳統用NLP分類PDs又慢又複雜。這項研究用Meta Llama2大型語言模型，開發自動化系統，能快速分類Roche系統裡的PDs，自動標記出超過八成可能影響結果的PDs，讓專家能聚焦審查，大幅提升效率，幾分鐘就能得到有用見解。 PubMed DOI

Detecting Adverse Drug Events in Clinical Notes Using Large Language Models.
使用大型語言模型偵測臨床紀錄中的藥物不良事件 Stud Health Technol Inform 2025-05-17

在電子病歷中找出藥物不良事件（ADEs）很困難，因為相關資訊多藏在醫師的自由書寫紀錄裡。人工審查又很耗時，所以需要自動化工具。這項研究用大型語言模型來偵測ADEs，發現不到15%的出院紀錄會明確記載ADEs與藥物的關聯，顯示通報機制還有很大改進空間。 PubMed DOI

Iterative refinement and goal articulation to optimize large language models for clinical information extraction.
以反覆精煉與目標明確化優化大型語言模型於臨床資訊擷取 NPJ Digit Med 2025-05-23

作者開發了一套端到端流程，運用大型語言模型（LLMs）從非結構化的病理報告中精準擷取並標準化資料，最初應用於腎臟腫瘤。這方法結合彈性提示設計、直接產生表格輸出及錯誤修正機制，於2,297份報告中達到極高準確率（macro F1最高0.99），也能應用於其他癌症，強調明確任務定義和跨領域合作的重要性。 PubMed DOI

Clinical Information Extraction with Large Language Models: A Case Study on Organ Procurement.
利用大型語言模型進行臨床資訊擷取：以器官摘取為案例研究 AMIA Annu Symp Proc 2025-05-26

這篇文章說明大型語言模型（LLMs）能準確從臨床文本抓取數值資料，像是檢驗數據和生命徵象。作者提出新提示策略和方法，能有效降低錯誤，並在標註病歷上驗證成果，也證明這方法適用於大量器官捐贈者資料分析，有助提升器官採集資料的研究可用性。 PubMed

Automatically Identifying Event Reports of Workplace Violence and Communication Failures using Large Language Models.
使用大型語言模型自動識別職場暴力事件報告與溝通失誤 AMIA Jt Summits Transl Sci Proc 2025-06-12

**重點整理：** 大型語言模型可以準確分類安全事件通報（例如：職場暴力、溝通失誤），協助醫療機構快速掌握安全趨勢，並透過自動化分析來提升職場安全。 PubMed

Using large language models to extract information from pediatric clinical reports.
利用大型語言模型從兒科臨床報告中擷取資訊 PLOS Digit Health 2025-07-23

大部分醫療紀錄都是非結構化，讓資料分析很困難。這項研究測試九種大型語言模型，能自動從兒科臨床報告擷取結構化資料。不論是商業還是開源模型，表現都很優秀，最好的模型辨識重要病患資訊的準確率超過九成。LLMs為醫療資料擷取提供靈活又準確的替代方案，有機會取代人工處理。 PubMed DOI

The need for guardrails with large language models in pharmacovigilance and other medical safety critical settings.
在藥物警戒及其他醫療安全關鍵情境中應設置大型語言模型的防護措施之必要性 Sci Rep 2025-07-30

大型語言模型雖然能協助知識型工作，但有時會產生錯誤資訊，對藥物安全來說風險很高。我們開發的防護機制能偵測問題資料、錯誤藥品或事件名稱，並表達不確定性。這些機制已整合進針對不良事件通報微調的模型中，有效降低關鍵錯誤，提升醫療安全與符合法規。 PubMed DOI

原始文章

站上相關主題文章列表