An Explainable Artificial Intelligence Text Classifier for Suicidality Prediction in Youth Crisis Text Line Users: Development and Validation Study.
一個可解釋的人工智慧文本分類器，用於預測青少年危機文本線用戶的自殺風險：開發與驗證研究。 JMIR Public Health Surveill 2025-01-29

這項研究針對自殺這一公共衛生議題，運用機器學習模型來識別有風險的個體，特別針對14至25歲的青少年。研究使用德國危機熱線的數據，開發預測自殺意念和行為的方法，並與傳統文本分類進行比較。基於變壓器的模型表現優異，達到0.89的宏觀AUC，並成功識別與自殺風險相關的語言特徵。研究結果顯示，這些模型能有效輔助臨床決策，未來可探索多模態輸入及時間性因素。 PubMed DOI

Large language models improve transferability of electronic health record-based predictions across countries and coding systems.
大型語言模型提升電子健康紀錄基礎預測在不同國家和編碼系統之間的可轉移性。 medRxiv 2025-02-20

這項研究介紹了GRASP，一種基於變壓器的模型，旨在利用電子健康紀錄（EHR）數據來提升疾病預測的準確性。透過將醫療代碼整合進大型語言模型，GRASP能有效預測21種疾病及全因死亡率，並在多個醫療系統中表現優異。訓練於英國生物銀行的GRASP，在FinnGen和西奈山醫院的測試中，C指數分別提升了83%和35%。即使數據集未統一，GRASP仍能準確預測疾病風險，顯示出其在不同醫療系統中可靠的應用潛力。 PubMed DOI

AI-based prediction of left bundle branch block risk post-TAVI using pre-implantation clinical parameters.
利用植入前臨床參數，基於AI預測TAVI術後左束支傳導阻滯風險 Future Cardiol 2025-04-29

這項研究發現，用傳統機器學習和大型語言模型（像GPT-4）來預測TAVI手術後新發LBBB風險，GPT-4表現最好，甚至超越傳統ML模型。結果顯示，只用手術前的臨床資料，就能準確預測LBBB發生機率，未來有助於臨床決策。 PubMed DOI

Large Language Models and Artificial Neural Networks for Assessing 1-Year Mortality in Patients With Myocardial Infarction: Analysis From the Medical Information Mart for Intensive Care IV (MIMIC-IV) Database.
用於評估心肌梗塞患者一年內死亡率之大型語言模型與人工神經網路：來自加護病房醫療資訊資料庫 MIMIC-IV 的分析 J Med Internet Res 2025-05-12

這項研究比較三種AI模型預測急性心肌梗塞病患一年內死亡率的準確度。結果顯示，傳統人工神經網路（SWEDEHEART-AI）表現最好，預測能力優於兩個大型語言模型（Qwen-2和Llama-3）。雖然LLM有潛力，但目前在臨床風險預測上還不如傳統模型，未來還需加強其準確度與校正能力。 PubMed DOI

A Large Language Model Approach to Identifying Preoperative Frailty Among Older Adults From Clinical Notes.
利用大型語言模型從臨床紀錄中辨識老年人術前虛弱狀態之方法 J Am Geriatr Soc 2025-05-15

這項研究用大型語言模型（像RoBERTa和PubMedBERT）分析麻醉門診紀錄，成功辨識出病人術前的虛弱狀態，不論用哪種虛弱定義，模型表現都很準確。結果證明，LLM能有效從日常臨床紀錄中抓出像虛弱這種複雜的健康問題。 PubMed DOI

Identification of Long-Term Care Facility Residence From Admission Notes Using Large Language Models.
利用大型語言模型從入院紀錄辨識長期照護機構居住狀態 JAMA Netw Open 2025-05-22

一項涵蓋13家醫院的研究發現，GPT-4-Turbo這種大型語言模型在判斷病人是否有近期長照機構接觸史時，準確度跟人工差不多甚至更高，速度快25倍、成本省20倍，還能抓出人工審查的錯誤。這代表AI能有效從醫療紀錄中擷取重要資訊，幫助提升感染控制和醫院作業效率。 PubMed DOI

Narrative Feature or Structured Feature? A Study of Large Language Models to Identify Cancer Patients at Risk of Heart Failure.
敘述型特徵或結構化特徵？大型語言模型於辨識有心衰竭風險癌症病患之研究 AMIA Annu Symp Proc 2025-05-26

這項研究用電子健康紀錄和機器學習，預測哪些癌症病人容易發展成心臟衰竭。結果發現，大型語言模型GatorTron-3.9B表現最好，尤其是結合醫療代碼的新特徵後，明顯勝過傳統和其他深度學習模型。這方法有助於更精準找出高風險病人，提升癌症照護品質。 PubMed

Comparing Text-Based Clinical Risk Prediction in Critical Care: A Note-Specific Hierarchical Network and Large Language Models.
重症醫療中文本式臨床風險預測之比較：特定病歷紀錄分層網路與大型語言模型 IEEE J Biomed Health Inform 2025-05-27

這篇研究發現，針對不同臨床紀錄類型設計的NLP模型，在預測住院死亡風險上，比傳統方法和34種大型語言模型（LLMs）都更準確。雖然LLMs在其他領域很強，但在這個任務上表現不佳，顯示現有LLMs在臨床應用上還有限制。這個新模型也有助於找出最有用的臨床紀錄。 PubMed DOI

Predicting 30-Day Postoperative Mortality and American Society of Anesthesiologists Physical Status Using Retrieval-Augmented Large Language Models: Development and Validation Study.
利用檢索增強大型語言模型預測30天術後死亡率與美國麻醉醫師學會身體狀態：開發與驗證研究 J Med Internet Res 2025-06-03

這項研究發現，把大型語言模型（LLM）結合檢索增強生成（RAG）技術，能更準確預測病患30天內的術後死亡率和ASA分級，尤其在辨識高風險個案時表現更好。LLaMA-RAG模型的準確度和解釋性都優於傳統方法，顯示這種AI工具有助於臨床決策輔助，未來在醫療現場很有應用潛力。 PubMed DOI

Diagnostic Performance of a Large Language Model for Determining the Cause of Death: A Comparative Analysis of Clinical History, Postmortem Computed Tomography Findings, and Their Integration.
大型語言模型於判斷死因之診斷效能：臨床病史、死後電腦斷層掃描結果及其整合的比較分析 Cureus 2025-06-09

這項研究發現，Claude 3.5 Sonnet大型語言模型在判斷死亡原因時，若同時結合臨床病史和死後CT報告，準確率最高（可達78%），比只用單一資訊還要好。不同疾病類型的準確率會有差異，血液腫瘤的提升最明顯。整體來說，整合多種資訊能有效提升AI判斷死亡原因的表現。 PubMed DOI

原始文章

站上相關主題文章列表