The foundational capabilities of large language models in predicting postoperative risks using clinical notes.
大型語言模型在利用臨床筆記預測術後風險的基礎能力。 NPJ Digit Med 2025-02-11

這項研究探討大型語言模型（LLMs）在預測病人術後風險的應用，分析了2018至2021年間的84,875份術前臨床筆記。結果顯示，LLMs在預測準確度上顯著優於傳統技術，AUROC提升了38.3%，AUPRC增長33.2%。透過自我監督微調，AUROC和AUPRC分別再增長3.2%和1.5%。加入標籤後，AUROC和AUPRC也有進一步提升。這些結果顯示LLMs在術後風險預測中具備重要應用潛力。 PubMed DOI

Large language models generating synthetic clinical datasets: a feasibility and comparative analysis with real-world perioperative data.
大型語言模型生成合成臨床數據集：可行性及與真實世界圍手術數據的比較分析。 Front Artif Intell 2025-02-20

這項研究探討使用OpenAI的GPT-4o生成合成臨床數據，以解決隱私法規和數據稀缺的問題。研究分為兩個階段：第一階段根據13個臨床參數創建了6,166個案例的結構化數據集，數據合理且準確；第二階段則利用真實的圍手術期數據集VitalDB生成數據，結果顯示92.31%的參數與VitalDB相似，且大多數參數間無顯著差異。研究顯示GPT-4o能有效生成反映實際臨床數據的合成數據，未來應進一步提高數據真實性並探索大型語言模型的潛力。 PubMed DOI

Surgery scheduling based on large language models.
基於大型語言模型的手術排程 Artif Intell Med 2025-05-11

這篇研究提出 LLM-NSGA 方法，讓大型語言模型（LLMs）來做多目標手術排程的最佳化，像是選擇、交配和突變等步驟。結果顯示，LLM-NSGA 在大規模問題上比傳統演算法（如 NSGA-II、MOEA/D）更優，有些目標甚至提升 80% 表現。LLMs 也能調整超參數，讓運算時間減少 23.68%，同時提升解決品質。整體來說，LLMs 不只產生高品質解答，也能強化傳統最佳化方法。 PubMed DOI

[Potential applications of large language models in trauma surgery : Opportunities, risks and perspectives].
大型語言模型在創傷外科的潛在應用：機會、風險與展望 Unfallchirurgie (Heidelb) 2025-05-12

**重點摘要：** 大型語言模型（LLMs）有機會提升創傷外科的照護品質，像是協助診斷、決策以及病人溝通等。不過，目前還有像是透明度不足、法律和倫理問題尚未解決等挑戰，所以在應用上需要謹慎監督，才能確保安全又有效的使用。 PubMed DOI

A Large Language Model Outperforms Other Computational Approaches to the High-Throughput Phenotyping of Physician Notes.
大型語言模型在醫師筆記高通量表現型分析中優於其他計算方法 AMIA Annu Symp Proc 2025-05-26

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現，GPT-4表現最好，顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具，有助於推動精準醫療發展。 PubMed

Large Language Models in Spine Surgery: A Promising Technology.
脊椎手術中的大型語言模型：一項前景看好的技術 HSS J 2025-06-02

**重點摘要（繁體中文）:** 大型語言模型（LLMs）在脊椎手術領域有很多潛在應用，包括提升病人衛教、協助研究、輔助臨床決策，以及幫助圍手術期照護。這篇綜述整理了目前LLMs在這些方面的應用現況與未來發展潛力，同時也討論了它們在這些領域中所面臨的限制與挑戰。 PubMed DOI

Predicting 30-Day Postoperative Mortality and American Society of Anesthesiologists Physical Status Using Retrieval-Augmented Large Language Models: Development and Validation Study.
利用檢索增強大型語言模型預測30天術後死亡率與美國麻醉醫師學會身體狀態：開發與驗證研究 J Med Internet Res 2025-06-03

這項研究發現，把大型語言模型（LLM）結合檢索增強生成（RAG）技術，能更準確預測病患30天內的術後死亡率和ASA分級，尤其在辨識高風險個案時表現更好。LLaMA-RAG模型的準確度和解釋性都優於傳統方法，顯示這種AI工具有助於臨床決策輔助，未來在醫療現場很有應用潛力。 PubMed DOI

Large language models in perioperative medicine-applications and future prospects: a narrative review.
圍手術期醫學中大型語言模型的應用與未來展望：敘述性回顧 Can J Anaesth 2025-06-09

大型語言模型（LLMs）在圍手術期醫學有助於整合臨床資料、輔助決策、加強病人衛教及研究，能提升醫療效率與準確性。但在真正應用到臨床前，還需克服資料安全、偏誤和可靠性等問題。 PubMed DOI

Language Models for Multilabel Document Classification of Surgical Concepts in Exploratory Laparotomy Operative Notes: Algorithm Development Study.
用於探索性剖腹手術紀錄中外科概念多標籤文件分類的語言模型：演算法開發研究 JMIR Med Inform 2025-07-09

這項研究比較傳統NLP方法和大型語言模型（像Llama 3）在擷取手術紀錄資訊的表現。結果顯示，Llama 3的準確度明顯高於其他方法，尤其在加入更多上下文後表現更好。不過，模型在分辨手術時序和語意細節上還有待加強。整體來說，LLM有潛力協助自動化手術紀錄審查，但臨床應用前還需進一步優化。 PubMed DOI

The Role of Large Language Models (LLMs) in Hepato-Pancreato-Biliary Surgery: Opportunities and Challenges.
大型語言模型（LLMs）在肝胰膽外科的角色：機會與挑戰 Cureus 2025-07-16

大型語言模型如 ChatGPT、Claude、Gemini，正逐步改變肝胰膽外科手術，包括自動化文件、輔助決策、手術規劃及病患監測。不過，資料隱私、AI 錯誤、倫理、教育及醫療不平等等問題仍待解決。未來需發展專業化模型、強化醫師與 AI 合作，並建立完善倫理規範，才能安全有效地應用於臨床。 PubMed DOI

原始文章

站上相關主題文章列表