原始文章

這項研究用大型語言模型(像RoBERTa和PubMedBERT)分析麻醉門診紀錄,成功辨識出病人術前的虛弱狀態,不論用哪種虛弱定義,模型表現都很準確。結果證明,LLM能有效從日常臨床紀錄中抓出像虛弱這種複雜的健康問題。 PubMed DOI


站上相關主題文章列表

虛弱是健康的重要指標,反映生理衰退帶來的脆弱性。這項研究探討了使用OpenAI的GPT-3.5-turbo模型進行虛弱評分的可靠性,並比較了基本提示與包含CFS定義的指令調整提示。結果顯示,LLM的評分與人類評分者相近,且指令調整提示在多數情境中表現出高可靠性。然而,在日常生活活動資訊不足的情況下,LLM可能會高估虛弱評分。這顯示LLM在醫療評估中有潛力,但仍需進一步研究其在臨床應用的角色。 PubMed DOI

這項研究探討大型語言模型(LLMs)在預測病人術後風險的應用,分析了2018至2021年間的84,875份術前臨床筆記。結果顯示,LLMs在預測準確度上顯著優於傳統技術,AUROC提升了38.3%,AUPRC增長33.2%。透過自我監督微調,AUROC和AUPRC分別再增長3.2%和1.5%。加入標籤後,AUROC和AUPRC也有進一步提升。這些結果顯示LLMs在術後風險預測中具備重要應用潛力。 PubMed DOI

本研究旨在建立一個框架,利用大型語言模型(LLMs)預測老年患者術後急性腎損傷(AKI)的結果。研究顯示,LLMs克服了傳統機器學習模型在預測疾病時的低泛化能力和可解釋性問題。透過提示工程和知識蒸餾,我們評估了來自中國和南韓的數據,結果顯示LLMs在準確率上優於傳統模型,並提供了可讀的解釋,改善臨床理解。此框架為臨床提供了更可靠的預測工具。 PubMed DOI

一項涵蓋13家醫院的研究發現,GPT-4-Turbo這種大型語言模型在判斷病人是否有近期長照機構接觸史時,準確度跟人工差不多甚至更高,速度快25倍、成本省20倍,還能抓出人工審查的錯誤。這代表AI能有效從醫療紀錄中擷取重要資訊,幫助提升感染控制和醫院作業效率。 PubMed DOI

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現,GPT-4表現最好,顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具,有助於推動精準醫療發展。 PubMed

這篇研究發現,針對不同臨床紀錄類型設計的NLP模型,在預測住院死亡風險上,比傳統方法和34種大型語言模型(LLMs)都更準確。雖然LLMs在其他領域很強,但在這個任務上表現不佳,顯示現有LLMs在臨床應用上還有限制。這個新模型也有助於找出最有用的臨床紀錄。 PubMed DOI

這項研究開發了一套新模型,把臨床資料轉成文字,再結合數值資訊,利用大型語言模型來預測心肺繞道手術前發生急性腎損傷的風險,準確率高達AUC 0.92。研究也找出哪些術前和術中措施有助預防AKI,能幫助醫師更早預測並預防相關風險。 PubMed DOI

研究團隊開發了一套經微調的大型語言模型,能自動從電子病歷的臨床紀錄中擷取阿茲海默症及相關失智症的7大症狀,準確度(AUROC)高達0.97-0.99,優於傳統方法。這些症狀不僅能預測失智症診斷,還和腦部MRI結果有關,有助提升診斷準確率並推動相關研究。 PubMed DOI

這項研究發現,把大型語言模型(LLM)結合檢索增強生成(RAG)技術,能更準確預測病患30天內的術後死亡率和ASA分級,尤其在辨識高風險個案時表現更好。LLaMA-RAG模型的準確度和解釋性都優於傳統方法,顯示這種AI工具有助於臨床決策輔助,未來在醫療現場很有應用潛力。 PubMed DOI

大型語言模型(LLMs)在圍手術期醫學有助於整合臨床資料、輔助決策、加強病人衛教及研究,能提升醫療效率與準確性。但在真正應用到臨床前,還需克服資料安全、偏誤和可靠性等問題。 PubMed DOI