Predicting 30-Day Postoperative Mortality and American Society of Anesthesiologists Physical Status Using Retrieval-Augmented Large Language Models: Development and Validation Study.
利用檢索增強大型語言模型預測30天術後死亡率與美國麻醉醫師學會身體狀態：開發與驗證研究 J Med Internet Res 2025-06-03

這項研究發現，把大型語言模型（LLM）結合檢索增強生成（RAG）技術，能更準確預測病患30天內的術後死亡率和ASA分級，尤其在辨識高風險個案時表現更好。LLaMA-RAG模型的準確度和解釋性都優於傳統方法，顯示這種AI工具有助於臨床決策輔助，未來在醫療現場很有應用潛力。相關文章 PubMed DOI 推理

High-Throughput Phenotyping of the Symptoms of Alzheimer Disease and Related Dementias Using Large Language Models: Cross-Sectional Study.
使用大型語言模型進行阿茲海默症及相關失智症症狀的高通量表現型分析：橫斷面研究 JMIR AI 2025-06-03

研究團隊開發了一套經微調的大型語言模型，能自動從電子病歷的臨床紀錄中擷取阿茲海默症及相關失智症的7大症狀，準確度（AUROC）高達0.97-0.99，優於傳統方法。這些症狀不僅能預測失智症診斷，還和腦部MRI結果有關，有助提升診斷準確率並推動相關研究。相關文章 PubMed DOI 推理

Evaluating the capacity of large language models to interpret emotions in images.
大型語言模型解讀影像中情緒能力之評估 PLoS One 2025-06-03

這項研究發現，GPT-4在辨識圖片情緒（愉悅度和激發度）時，表現和人類相近，但對細微情緒還是有點吃力。這代表未來用GPT-4來自動篩選和驗證情緒刺激，有機會大幅減少人力、提升效率。相關文章 PubMed DOI 推理

Dynamic few-shot prompting for clinical note section classification using lightweight, open-source large language models.
使用輕量級開源大型語言模型進行臨床紀錄分段分類的動態少樣本提示 J Am Med Inform Assoc 2025-06-03

這項研究發現，透過 embedding similarity 動態挑選最相關範例來做 few-shot prompting，可以大幅提升開源輕量級 LLM 在臨床紀錄分類的表現。這方法比 zero-shot 最多提升 39.3% macro F1 分數，也比靜態 few-shot 高出 21.1%，證明在臨床 NLP 任務上很有實用價值。相關文章 PubMed DOI 推理

Artificial Intelligence Chatbots as Virtual Patients in Dental Education: A Constructivist Approach to Classroom Implementation.
人工智慧聊天機器人作為牙科教育中的虛擬病人：建構主義取向的課堂實施 Eur J Dent Educ 2025-06-03

這項研究設計了一個用 ChatGPT-4 進行 AI 角色扮演的活動，讓牙科相關科系學生模擬病患諮詢和老師討論。學生普遍覺得活動真實又實用，對臨床技能練習很有幫助，操作簡單、成本低（20 人只花約 13 美元）。這種方式有助同儕學習，也能發現自己在病史詢問上的不足，未來有潛力應用於臨床訓練，但還需更多研究證實成效。相關文章 PubMed DOI 推理

Performance of DeepSeek-R1 and ChatGPT-4o on the Chinese National Medical Licensing Examination: A Comparative Study.
DeepSeek-R1 與 ChatGPT-4o 在中國國家醫師執照考試的表現：一項比較研究 J Med Syst 2025-06-03

這項研究比較 DeepSeek-R1 和 ChatGPT-4o 兩個大型語言模型在 2024 年中國國家醫師執業資格考試的表現。結果顯示，DeepSeek-R1 的正確率（92.0%）明顯高於 ChatGPT-4o（87.2%），尤其在簡單題目上表現更好，但在難題或特定科目上兩者差異不大。整體來說，DeepSeek-R1 表現較優。相關文章 PubMed DOI 推理

The Role of Artificial Intelligence Large Language Models in Personalized Rehabilitation Programs for Knee Osteoarthritis: An Observational Study.
人工智慧大型語言模型在膝關節骨關節炎個人化復健計畫中的角色：一項觀察性研究 J Med Syst 2025-06-03

這項研究發現，ChatGPT-4o 和 Gemini Advanced 在設計膝蓋骨關節炎復健計畫時，和物理治療師的整體一致性不錯，但在運動細節上還有待加強。ChatGPT-4o 表現較佳，尤其在進階階段。不過，這些 AI 目前還缺乏臨床判斷和細節指導，臨床應用前仍需專家把關與優化。相關文章 PubMed DOI 推理

Advancing Musculoskeletal Care Using AI and Digital Health Applications: A Review of Commercial Solutions.
運用 AI 與數位健康應用於提升肌肉骨骼照護：商業解決方案之綜述 HSS J 2025-06-03

AI和數位健康正大幅改變肌肉骨骼照護，不只提升診斷和治療效率，也減輕醫師行政負擔。AI能強化影像判讀、協助分流和個人化治療，但目前還有演算法偏誤、法規差異等挑戰。未來若能安全且有效整合，MSK照護將更精準。相關文章 PubMed DOI 推理

The climate gluing protests: analyzing their development and framing in media since 1986 using sentiment analyses and frame detection models.
氣候黏貼抗議行動：自1986年以來其發展及媒體框架之分析，結合情感分析與框架偵測模型 Front Big Data 2025-06-03

這篇研究分析英文媒體怎麼報導「gluing」抗議（像把自己黏在物體上的行動），發現現在這類抗議多跟氣候行動有關。媒體報導普遍偏負面，但公共媒體較中立。抗議者很少提解決方法，新聞則多聚焦政策和安全。研究也提到用 NLP 分析新聞的困難，未來大型語言模型有機會改善，但也會有新挑戰。相關文章 PubMed DOI 推理

Assessing the accuracy and explainability of using ChatGPT to evaluate the quality of health news.
使用 ChatGPT 評估健康新聞品質之準確性與可解釋性分析 BMC Public Health 2025-06-02

這項研究發現，GPT-3.5-Turbo在判斷健康新聞品質時，評分準確度雖然不如傳統機器學習模型，尤其在某些標準上表現較弱，但它能提供清楚且有條理的解釋。整體來說，GPT-3.5-Turbo仍有潛力幫助大家更好理解健康資訊，提升健康素養，並對抗錯誤訊息。相關文章 PubMed DOI 推理

LLM 相關三個月內文章 / 第 76 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

LLM 相關三個月內文章 / 第 76 頁

可選擇其它分類: 一週新進文章 腎臟科 一般醫學 SGLT2i GLP1

可選擇其它分類: 一週新進文章腎臟科一般醫學 SGLT2i GLP1