原始文章

研究發現,經微調的GPT-4能從臨床紀錄中預測手術時間,準確度比傳統方法更高。在超過12萬5千個案例中,GPT-4平均誤差約48分鐘,顯示大型語言模型有助提升手術室排程效率,未來有望改善醫療資源運用。 PubMed DOI


站上相關主題文章列表

這項研究探討大型語言模型(LLMs)在預測病人術後風險的應用,分析了2018至2021年間的84,875份術前臨床筆記。結果顯示,LLMs在預測準確度上顯著優於傳統技術,AUROC提升了38.3%,AUPRC增長33.2%。透過自我監督微調,AUROC和AUPRC分別再增長3.2%和1.5%。加入標籤後,AUROC和AUPRC也有進一步提升。這些結果顯示LLMs在術後風險預測中具備重要應用潛力。 PubMed DOI

這項研究探討使用OpenAI的GPT-4o生成合成臨床數據,以解決隱私法規和數據稀缺的問題。研究分為兩個階段:第一階段根據13個臨床參數創建了6,166個案例的結構化數據集,數據合理且準確;第二階段則利用真實的圍手術期數據集VitalDB生成數據,結果顯示92.31%的參數與VitalDB相似,且大多數參數間無顯著差異。研究顯示GPT-4o能有效生成反映實際臨床數據的合成數據,未來應進一步提高數據真實性並探索大型語言模型的潛力。 PubMed DOI

這篇研究提出 LLM-NSGA 方法,讓大型語言模型(LLMs)來做多目標手術排程的最佳化,像是選擇、交配和突變等步驟。結果顯示,LLM-NSGA 在大規模問題上比傳統演算法(如 NSGA-II、MOEA/D)更優,有些目標甚至提升 80% 表現。LLMs 也能調整超參數,讓運算時間減少 23.68%,同時提升解決品質。整體來說,LLMs 不只產生高品質解答,也能強化傳統最佳化方法。 PubMed DOI

**重點摘要:** 大型語言模型(LLMs)有機會提升創傷外科的照護品質,像是協助診斷、決策以及病人溝通等。不過,目前還有像是透明度不足、法律和倫理問題尚未解決等挑戰,所以在應用上需要謹慎監督,才能確保安全又有效的使用。 PubMed DOI

這篇研究比較GPT-4大型語言模型、深度學習和機器學習三種方法在電子病歷症狀標準化上的表現。結果發現,GPT-4表現最好,顯示大型語言模型很有潛力成為未來醫師筆記自動化分析的主流工具,有助於推動精準醫療發展。 PubMed

**重點摘要(繁體中文):** 大型語言模型(LLMs)在脊椎手術領域有很多潛在應用,包括提升病人衛教、協助研究、輔助臨床決策,以及幫助圍手術期照護。這篇綜述整理了目前LLMs在這些方面的應用現況與未來發展潛力,同時也討論了它們在這些領域中所面臨的限制與挑戰。 PubMed DOI

這項研究發現,把大型語言模型(LLM)結合檢索增強生成(RAG)技術,能更準確預測病患30天內的術後死亡率和ASA分級,尤其在辨識高風險個案時表現更好。LLaMA-RAG模型的準確度和解釋性都優於傳統方法,顯示這種AI工具有助於臨床決策輔助,未來在醫療現場很有應用潛力。 PubMed DOI

大型語言模型(LLMs)在圍手術期醫學有助於整合臨床資料、輔助決策、加強病人衛教及研究,能提升醫療效率與準確性。但在真正應用到臨床前,還需克服資料安全、偏誤和可靠性等問題。 PubMed DOI

這項研究比較傳統NLP方法和大型語言模型(像Llama 3)在擷取手術紀錄資訊的表現。結果顯示,Llama 3的準確度明顯高於其他方法,尤其在加入更多上下文後表現更好。不過,模型在分辨手術時序和語意細節上還有待加強。整體來說,LLM有潛力協助自動化手術紀錄審查,但臨床應用前還需進一步優化。 PubMed DOI

大型語言模型如 ChatGPT、Claude、Gemini,正逐步改變肝胰膽外科手術,包括自動化文件、輔助決策、手術規劃及病患監測。不過,資料隱私、AI 錯誤、倫理、教育及醫療不平等等問題仍待解決。未來需發展專業化模型、強化醫師與 AI 合作,並建立完善倫理規範,才能安全有效地應用於臨床。 PubMed DOI