原始文章

這項研究用transformer深度學習模型,分析美國29年健康與退休資料,預測年長者死亡率。模型涵蓋財務、身心健康等126項風險因子,預測準確度比傳統方法高出許多,平均精確度甚至提升一倍。結果顯示transformer模型在老化與死亡風險預測上很有潛力。 PubMed DOI


站上相關主題文章列表

這項研究針對自殺這一公共衛生議題,運用機器學習模型來識別有風險的個體,特別針對14至25歲的青少年。研究使用德國危機熱線的數據,開發預測自殺意念和行為的方法,並與傳統文本分類進行比較。基於變壓器的模型表現優異,達到0.89的宏觀AUC,並成功識別與自殺風險相關的語言特徵。研究結果顯示,這些模型能有效輔助臨床決策,未來可探索多模態輸入及時間性因素。 PubMed DOI

這項研究介紹了GRASP,一種基於變壓器的模型,旨在利用電子健康紀錄(EHR)數據來提升疾病預測的準確性。透過將醫療代碼整合進大型語言模型,GRASP能有效預測21種疾病及全因死亡率,並在多個醫療系統中表現優異。訓練於英國生物銀行的GRASP,在FinnGen和西奈山醫院的測試中,C指數分別提升了83%和35%。即使數據集未統一,GRASP仍能準確預測疾病風險,顯示出其在不同醫療系統中可靠的應用潛力。 PubMed DOI

這項研究發現,用傳統機器學習和大型語言模型(像GPT-4)來預測TAVI手術後新發LBBB風險,GPT-4表現最好,甚至超越傳統ML模型。結果顯示,只用手術前的臨床資料,就能準確預測LBBB發生機率,未來有助於臨床決策。 PubMed DOI

這項研究比較三種AI模型預測急性心肌梗塞病患一年內死亡率的準確度。結果顯示,傳統人工神經網路(SWEDEHEART-AI)表現最好,預測能力優於兩個大型語言模型(Qwen-2和Llama-3)。雖然LLM有潛力,但目前在臨床風險預測上還不如傳統模型,未來還需加強其準確度與校正能力。 PubMed DOI

這項研究用大型語言模型(像RoBERTa和PubMedBERT)分析麻醉門診紀錄,成功辨識出病人術前的虛弱狀態,不論用哪種虛弱定義,模型表現都很準確。結果證明,LLM能有效從日常臨床紀錄中抓出像虛弱這種複雜的健康問題。 PubMed DOI

一項涵蓋13家醫院的研究發現,GPT-4-Turbo這種大型語言模型在判斷病人是否有近期長照機構接觸史時,準確度跟人工差不多甚至更高,速度快25倍、成本省20倍,還能抓出人工審查的錯誤。這代表AI能有效從醫療紀錄中擷取重要資訊,幫助提升感染控制和醫院作業效率。 PubMed DOI

這項研究用電子健康紀錄和機器學習,預測哪些癌症病人容易發展成心臟衰竭。結果發現,大型語言模型GatorTron-3.9B表現最好,尤其是結合醫療代碼的新特徵後,明顯勝過傳統和其他深度學習模型。這方法有助於更精準找出高風險病人,提升癌症照護品質。 PubMed

這篇研究發現,針對不同臨床紀錄類型設計的NLP模型,在預測住院死亡風險上,比傳統方法和34種大型語言模型(LLMs)都更準確。雖然LLMs在其他領域很強,但在這個任務上表現不佳,顯示現有LLMs在臨床應用上還有限制。這個新模型也有助於找出最有用的臨床紀錄。 PubMed DOI

這項研究發現,把大型語言模型(LLM)結合檢索增強生成(RAG)技術,能更準確預測病患30天內的術後死亡率和ASA分級,尤其在辨識高風險個案時表現更好。LLaMA-RAG模型的準確度和解釋性都優於傳統方法,顯示這種AI工具有助於臨床決策輔助,未來在醫療現場很有應用潛力。 PubMed DOI

這項研究發現,Claude 3.5 Sonnet大型語言模型在判斷死亡原因時,若同時結合臨床病史和死後CT報告,準確率最高(可達78%),比只用單一資訊還要好。不同疾病類型的準確率會有差異,血液腫瘤的提升最明顯。整體來說,整合多種資訊能有效提升AI判斷死亡原因的表現。 PubMed DOI