Current applications and challenges in large language models for patient care: a systematic review.
大型語言模型在病患照護中的現行應用與挑戰：系統性回顧。 Commun Med (Lond) 2025-01-21

大型語言模型（LLMs）在臨床實踐中有潛力提升病人教育與賦權，提供更個人化的醫療服務。然而，目前對其在病人照護中的應用資訊仍不夠完整。本系統性回顧分析了2022至2023年間的89項相關研究，主要集中於GPT-3.5和GPT-4，應用於回答醫療問題、生成病人資訊等。研究指出設計和輸出方面的限制，包括缺乏針對醫療的優化及數據透明度等問題。此回顧為LLMs在醫療環境中的應用與評估提供了基礎框架。 PubMed DOI

A systematic review of large language model (LLM) evaluations in clinical medicine.
大型語言模型 (LLM) 在臨床醫學評估中的系統性回顧。 BMC Med Inform Decis Mak 2025-03-07

大型語言模型（LLMs）在臨床醫學中展現出潛力，能改善決策支持、診斷及醫學教育。不過，將其整合進臨床流程需徹底評估，以確保可靠性、安全性及倫理性。本系統性回顧調查了LLMs在臨床環境中的評估方法，發現大多數研究集中於一般領域的LLMs，醫學領域的研究較少。準確性是最常評估的參數。儘管對LLMs的興趣上升，研究中仍存在限制與偏見，未來需建立標準化框架，確保其安全有效地應用於臨床實踐。 PubMed DOI

ChatGPT and Other Large Language Models in Medical Education - Scoping Literature Review.
醫學教育中的 ChatGPT 及其他大型語言模型 - 文獻範疇回顧。 Med Sci Educ 2025-03-27

這篇綜述回顧了大型語言模型（LLMs）在醫學教育中的應用，涵蓋了第一年內的相關文獻。根據PRISMA指導方針，研究者搜尋了五個科學資料庫，最終納入145項研究。大部分研究聚焦於LLMs通過醫學考試的能力，還有一些探討其優缺點及潛在應用。不過，實證研究較少，且方法學上不夠嚴謹。為了改善這些問題，文獻提出了一個研究議程，期望提升未來相關研究的質量。 PubMed DOI

Large language models in critical care.
重症醫療中的大型語言模型 J Intensive Med 2025-04-17

大型語言模型像 ChatGPT 正在改變重症醫學，能自動化病歷、協助決策、個人化溝通，還能整理非結構化資料。不過，目前還有資訊正確性、倫理和醫師AI素養等挑戰。結合傳統機器學習可降低風險，導入時要謹慎並加強醫師訓練，才能提升照護品質。 PubMed DOI

The impact of the large language model ChatGPT in oral and maxillofacial surgery: a systematic review.
大型語言模型 ChatGPT 在口腔顎面外科的影響：系統性回顧 Br J Oral Maxillofac Surg 2025-04-18

這篇系統性回顧發現，ChatGPT在口腔顎面外科的臨床決策、手術規劃和病患衛教等方面有輔助效果，尤其在產生手術同意書和術後支持表現不錯，但在藥理學和複雜病例處理上仍有限。建議將ChatGPT作為輔助工具，需專業人員監督，不能完全取代醫師判斷。 PubMed DOI

Accuracy of Large Language Models When Answering Clinical Research Questions: Systematic Review and Network Meta-Analysis.
大型語言模型在回答臨床研究問題時的準確性：系統性回顧與網絡統合分析 J Med Internet Res 2025-04-30

這篇回顧分析168篇研究，發現ChatGPT-4o在選擇題最準，ChatGPT-4開放式問題表現最好，但人類醫師在前1和前3名診斷還是最強。Claude 3 Opus在前5名診斷勝出，Gemini則在分級和分類任務表現最佳。這些結果可作為醫療現場選用AI輔助的參考依據。 PubMed DOI

Impact of large language model (ChatGPT) in healthcare: an umbrella review and evidence synthesis.
大型語言模型（ChatGPT）在醫療保健中的影響：綜合性回顧與證據統合 J Biomed Sci 2025-05-07

這篇回顧整理了17篇關於ChatGPT在醫療應用的研究，發現它在病患照護、臨床決策和醫學教育上有潛力，應用範圍廣泛。不過，目前多數研究品質普通，且在倫理、法律和準確性上還有疑慮。未來需要更完善的指引和政策，才能確保安全可靠地使用。 PubMed DOI

Large language models in perioperative medicine-applications and future prospects: a narrative review.
圍手術期醫學中大型語言模型的應用與未來展望：敘述性回顧 Can J Anaesth 2025-06-09

大型語言模型（LLMs）在圍手術期醫學有助於整合臨床資料、輔助決策、加強病人衛教及研究，能提升醫療效率與準確性。但在真正應用到臨床前，還需克服資料安全、偏誤和可靠性等問題。 PubMed DOI

Evaluating Large Language Models on American Board of Anesthesiology-style Anesthesiology Questions: Accuracy, Domain Consistency, and Clinical Implications.
以美國麻醉科醫學會（American Board of Anesthesiology）風格麻醉學試題評估大型語言模型：準確性、領域一致性與臨床意涵 J Cardiothorac Vasc Anesth 2025-06-15

五款主流大型語言模型（如ChatGPT-4、Gemini等）在麻醉學考題測試中都拿到高分，彼此表現差不多，顯示未來有望協助醫學教育和臨床決策。不過，還需要更多研究來確認它們的可靠性、倫理問題及對病患照護的實際影響。 PubMed DOI

Implementing Large Language Models in Health Care: Clinician-Focused Review With Interactive Guideline.
在醫療保健中導入大型語言模型：以臨床醫師為中心的綜述與互動式指引 J Med Internet Res 2025-07-11

這篇綜述分析270篇文獻，發現現有大型語言模型（如GPT-4）雖然能協助醫師處理多種臨床任務，但沒有單一模型能全面勝任所有需求，專業任務還需客製化。多數先進模型又是封閉原始碼，造成透明度和隱私疑慮。作者建議建立簡單易懂的線上指引，幫助醫師選擇合適的LLM。 PubMed DOI

原始文章

站上相關主題文章列表