The Transformative Potential of Large Language Models in Mining Electronic Health Records Data: Content Analysis.
大型語言模型在挖掘電子健康紀錄數據中的變革潛力：內容分析。 JMIR Med Inform 2025-01-02

這項研究評估了大型語言模型（LLMs），特別是GPT-3.5和GPT-4，在從腫瘤科電子健康紀錄中提取患者共病情況的表現。研究分析了250份病歷報告，結果顯示GPT-4在敏感性上表現優於GPT-3.5和醫生，達到96.8%。雖然醫生在精確度上稍勝一籌，但GPT-4的表現更一致，且能推斷出非明確的共病情況。整體而言，這些模型在提取資訊方面顯示出潛力，可能成為數據挖掘的重要工具。 PubMed DOI

Large language models vs human for classifying clinical documents.
大型語言模型與人類在臨床文件分類中的比較。 Int J Med Inform 2025-01-23

這項研究探討了使用先進的大型語言模型，如ChatGPT 3.5和ChatGPT 4，來提升醫療紀錄中ICD-10代碼的分類準確性，特別是針對現有方法識別為假陰性的紀錄。研究在MIMIC IV數據集的802份出院摘要上進行，結果顯示ChatGPT 4的匹配率為86%到89%，明顯優於ChatGPT 3.5的57%到67%。雖然經驗豐富的人類編碼員表現更佳，但ChatGPT 4的準確性已達到人類編碼員的中位數。這顯示將這類模型整合進臨床編碼中，能提升醫療文檔的準確性，特別在複雜案例中。 PubMed DOI

Large language models in critical care.
重症醫療中的大型語言模型 J Intensive Med 2025-04-17

大型語言模型像 ChatGPT 正在改變重症醫學，能自動化病歷、協助決策、個人化溝通，還能整理非結構化資料。不過，目前還有資訊正確性、倫理和醫師AI素養等挑戰。結合傳統機器學習可降低風險，導入時要謹慎並加強醫師訓練，才能提升照護品質。 PubMed DOI

Using Generative Artificial Intelligence in Health Economics and Outcomes Research: A Primer on Techniques and Breakthroughs.
在健康經濟與療效研究中應用生成式人工智慧：技術與突破入門 Pharmacoecon Open 2025-04-29

生成式AI（像ChatGPT）能大幅提升健康經濟與療效研究（HEOR）效率，協助自動化文獻回顧、資料擷取和報告撰寫。健康經濟學家應學習相關工具和技術，但要注意資料安全、偏誤和倫理問題。導入AI時，需兼顧創新、科學嚴謹與倫理，並公開方法細節，確保風險可控。 PubMed DOI

The emergence of large language models as tools in literature reviews: a large language model-assisted systematic review.
大型語言模型作為文獻回顧工具的興起：大型語言模型輔助的系統性回顧 J Am Med Inform Assoc 2025-05-07

這篇研究回顧了LLM在自動化科學文獻回顧的應用，分析了172篇論文。多數專案用ChatGPT或GPT系列，特別在文獻搜尋和資料擷取上表現比BERT好。不過，實際上很少有論文註明用LLM協助。雖然LLM處理數值資料還有些限制，但未來很可能會大幅改變文獻回顧的流程。 PubMed DOI

Clinical Information Extraction with Large Language Models: A Case Study on Organ Procurement.
利用大型語言模型進行臨床資訊擷取：以器官摘取為案例研究 AMIA Annu Symp Proc 2025-05-26

這篇文章說明大型語言模型（LLMs）能準確從臨床文本抓取數值資料，像是檢驗數據和生命徵象。作者提出新提示策略和方法，能有效降低錯誤，並在標註病歷上驗證成果，也證明這方法適用於大量器官捐贈者資料分析，有助提升器官採集資料的研究可用性。 PubMed

SDoH-GPT: using large language models to extract social determinants of health.
SDoH-GPT：運用大型語言模型萃取健康社會決定因素 J Am Med Inform Assoc 2025-06-10

SDoH-GPT 是一套新方法，結合大型語言模型、少量範例學習和 XGBoost 分類器，能自動從醫療紀錄擷取健康社會決定因素。這大幅減少人工標註，省時又省錢，準確度也很高（Cohen’s kappa 0.92、AUROC 超過 0.90），已在三個資料集驗證，讓醫療界更容易運用 SDoH 資料。 PubMed DOI

Evaluating and leveraging large language models in clinical pharmacology and therapeutics assessment: From exam takers to exam shapers.
在臨床藥理學與治療學評估中評價與應用大型語言模型：從考生到考題設計者 Br J Clin Pharmacol 2025-06-10

最新研究發現，像 ChatGPT-4 Omni 這類大型語言模型，在 CPT 和歐洲處方考試的表現跟醫學生差不多，甚至更厲害，特別是在知識和開藥技巧上。這些 AI 還能揪出題目寫不清楚的地方，不只適合當教學工具，也有助於改進考題品質。 PubMed DOI

Exploring ChatGPT 3.5 for structured data extraction from oncological notes.
運用 ChatGPT 3.5 於腫瘤學病歷結構化資料擷取之探討 AMIA Jt Summits Transl Sci Proc 2025-06-12

研究發現，ChatGPT能準確從非結構化臨床紀錄中擷取癌症病患的關鍵資料，如Gleason分數和年齡（F1=0.99），對安寧照護和疼痛狀態的辨識也不錯（F1=0.86）。但few-shot提示有時反而降低準確度，加入背景資訊也未必有幫助。整體來說，ChatGPT有潛力協助電子病歷資料結構化，促進醫療研究資料共享。 PubMed

Generative Artificial Intelligence to Automate the Adaptation of Excel Health Economic Models and Word Technical Reports.
運用生成式人工智慧自動化調整 Excel 健康經濟模型與 Word 技術報告 Value Health 2025-06-16

大型語言模型（LLMs）能自動化調整 Excel 健康經濟模型和技術報告到新情境，準確率高、成本低。只要幾分鐘、幾美元就能完成，且調整結果幾乎完美。這方法有望加快健康科技評估流程，讓病患更快取得治療。 PubMed DOI

原始文章

站上相關主題文章列表