The foundational capabilities of large language models in predicting postoperative risks using clinical notes.
大型語言模型在利用臨床筆記預測術後風險的基礎能力。 NPJ Digit Med 2025-02-11

這項研究探討大型語言模型（LLMs）在預測病人術後風險的應用，分析了2018至2021年間的84,875份術前臨床筆記。結果顯示，LLMs在預測準確度上顯著優於傳統技術，AUROC提升了38.3%，AUPRC增長33.2%。透過自我監督微調，AUROC和AUPRC分別再增長3.2%和1.5%。加入標籤後，AUROC和AUPRC也有進一步提升。這些結果顯示LLMs在術後風險預測中具備重要應用潛力。 PubMed DOI

Leveraging Large Language Models for Predicting Postoperative Acute Kidney Injury in Elderly Patients.
利用大型語言模型預測老年患者術後急性腎損傷。 BME Front 2025-03-12

本研究旨在建立一個框架，利用大型語言模型（LLMs）預測老年患者術後急性腎損傷（AKI）的結果。研究顯示，LLMs克服了傳統機器學習模型在預測疾病時的低泛化能力和可解釋性問題。透過提示工程和知識蒸餾，我們評估了來自中國和南韓的數據，結果顯示LLMs在準確率上優於傳統模型，並提供了可讀的解釋，改善臨床理解。此框架為臨床提供了更可靠的預測工具。 PubMed DOI

Identification of Long-Term Care Facility Residence From Admission Notes Using Large Language Models.
利用大型語言模型從入院紀錄辨識長期照護機構居住狀態 JAMA Netw Open 2025-05-22

一項涵蓋13家醫院的研究發現，GPT-4-Turbo這種大型語言模型在判斷病人是否有近期長照機構接觸史時，準確度跟人工差不多甚至更高，速度快25倍、成本省20倍，還能抓出人工審查的錯誤。這代表AI能有效從醫療紀錄中擷取重要資訊，幫助提升感染控制和醫院作業效率。 PubMed DOI

A Large Language Model Outperforms Other Computational Approaches to the High-Throughput Phenotyping of Physician Notes.
大型語言模型在醫師筆記高通量表現型分析中優於其他計算方法 AMIA Annu Symp Proc 2025-05-26

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現，GPT-4表現最好，顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具，有助於推動精準醫療發展。 PubMed

Comparing Text-Based Clinical Risk Prediction in Critical Care: A Note-Specific Hierarchical Network and Large Language Models.
重症醫療中文本式臨床風險預測之比較：特定病歷紀錄分層網路與大型語言模型 IEEE J Biomed Health Inform 2025-05-27

這篇研究發現，針對不同臨床紀錄類型設計的NLP模型，在預測住院死亡風險上，比傳統方法和34種大型語言模型（LLMs）都更準確。雖然LLMs在其他領域很強，但在這個任務上表現不佳，顯示現有LLMs在臨床應用上還有限制。這個新模型也有助於找出最有用的臨床紀錄。 PubMed DOI

Leveraging large language models for preoperative prevention of cardiopulmonary bypass-associated acute kidney injury.
運用大型語言模型於心肺繞道相關急性腎損傷的術前預防 Ren Fail 2025-05-30

這項研究開發了一套新模型，把臨床資料轉成文字，再結合數值資訊，利用大型語言模型來預測心肺繞道手術前發生急性腎損傷的風險，準確率高達AUC 0.92。研究也找出哪些術前和術中措施有助預防AKI，能幫助醫師更早預測並預防相關風險。 PubMed DOI

Predicting 30-Day Postoperative Mortality and American Society of Anesthesiologists Physical Status Using Retrieval-Augmented Large Language Models: Development and Validation Study.
利用檢索增強大型語言模型預測30天術後死亡率與美國麻醉醫師學會身體狀態：開發與驗證研究 J Med Internet Res 2025-06-03

這項研究發現，把大型語言模型（LLM）結合檢索增強生成（RAG）技術，能更準確預測病患30天內的術後死亡率和ASA分級，尤其在辨識高風險個案時表現更好。LLaMA-RAG模型的準確度和解釋性都優於傳統方法，顯示這種AI工具有助於臨床決策輔助，未來在醫療現場很有應用潛力。 PubMed DOI

Large language models in perioperative medicine-applications and future prospects: a narrative review.
圍手術期醫學中大型語言模型的應用與未來展望：敘述性回顧 Can J Anaesth 2025-06-09

大型語言模型（LLMs）在圍手術期醫學有助於整合臨床資料、輔助決策、加強病人衛教及研究，能提升醫療效率與準確性。但在真正應用到臨床前，還需克服資料安全、偏誤和可靠性等問題。 PubMed DOI

Language Models for Multilabel Document Classification of Surgical Concepts in Exploratory Laparotomy Operative Notes: Algorithm Development Study.
用於探索性剖腹手術紀錄中外科概念多標籤文件分類的語言模型：演算法開發研究 JMIR Med Inform 2025-07-09

這項研究比較傳統NLP方法和大型語言模型（像Llama 3）在擷取手術紀錄資訊的表現。結果顯示，Llama 3的準確度明顯高於其他方法，尤其在加入更多上下文後表現更好。不過，模型在分辨手術時序和語意細節上還有待加強。整體來說，LLM有潛力協助自動化手術紀錄審查，但臨床應用前還需進一步優化。 PubMed DOI

Mobility Functional Status Ascertainment in Electronic Health Records using Large Language Models.
利用大型語言模型於電子健康紀錄中判定行動功能狀態 Res Sq 2025-08-06

這項研究發現，Llama 3等大型語言模型能準確從電子病歷的臨床紀錄中提取並標準化病人行動能力資訊。經過多家醫院600份紀錄測試，模型在提取和分類上表現優異，錯誤也多屬臨床可接受範圍。本地端運行模型更能保障隱私與一致性，顯示LLMs有助於精準醫療與研究發展。 PubMed DOI

原始文章

站上相關主題文章列表