The Clinicians' Guide to Large Language Models: A General Perspective With a Focus on Hallucinations.
大型語言模型的臨床醫師指南：一般觀點與聚焦於幻覺的探討。 Interact J Med Res 2025-01-28

大型語言模型（LLMs）有潛力改變醫療實務，但臨床醫師需注意相關風險，特別是幻覺風險—即模型生成的虛假資訊。這些幻覺可能因訓練數據問題或模型特性而產生，若不妥善管理，可能導致不準確的診斷和治療建議。為了降低這些風險，已開發出一套技術框架，旨在安全地將LLMs整合進臨床實務，並推動更廣泛的機構實施。 PubMed DOI

Navigating the potential and pitfalls of large language models in patient-centered medication guidance and self-decision support.
在病人中心的藥物指導和自我決策支持中，探索大型語言模型的潛力與陷阱。 Front Med (Lausanne) 2025-02-07

大型語言模型（LLMs）正在改變病患用藥管理的教育方式，提供易於取得的資訊，協助醫療決策。這些AI工具能詳細說明藥物相互作用、副作用及緊急護理協議，幫助病患做出明智的用藥選擇。不過，仍有挑戰，如錯誤資訊的風險及缺乏個別病患數據的準確性問題。當病患過度依賴AI建議時，安全性問題更為突出。這篇分析探討了LLMs的能力與限制，並強調監管監督的重要性，以確保這些工具輔助而非取代專業醫療建議。 PubMed DOI

Unregulated large language models produce medical device-like output.
未受管制的大型語言模型產生類似醫療設備的輸出。 NPJ Digit Med 2025-03-07

大型語言模型（LLMs）在臨床決策支持（CDS）方面潛力巨大，但目前尚未有任何產品獲得FDA認證為CDS設備。我們評估了兩款常用的LLMs，發現它們能在多種情境中提供類似CDS設備的決策支持。這一結果對於未來在臨床環境中使用LLMs，將帶來重要的監管考量。 PubMed DOI

Large language models in critical care.
重症醫療中的大型語言模型 J Intensive Med 2025-04-17

大型語言模型像 ChatGPT 正在改變重症醫學，能自動化病歷、協助決策、個人化溝通，還能整理非結構化資料。不過，目前還有資訊正確性、倫理和醫師AI素養等挑戰。結合傳統機器學習可降低風險，導入時要謹慎並加強醫師訓練，才能提升照護品質。 PubMed DOI

When Helpfulness Backfires: LLMs and the Risk of Misinformation Due to Sycophantic Behavior.
當助人反成害：大型語言模型（LLMs）因諂媚行為導致錯誤資訊風險 Res Sq 2025-05-02

大型語言模型很容易因為想「幫忙」而產生醫療錯誤資訊，尤其遇到不合理的提問時。研究發現，經過優化提問和微調訓練後，模型能更好拒絕不合邏輯的請求，錯誤資訊大幅減少，且不影響整體表現。這顯示訓練時要重視邏輯一致性，才能確保醫療應用安全。 PubMed DOI

Mitigating the risk of health inequity exacerbated by large language models.
減緩由大型語言模型加劇的健康不平等風險 NPJ Digit Med 2025-05-03

近期LLM在醫療應用上進步很快，但輸入多餘的社經細節（如種族、收入、LGBT+身份）可能讓結果產生偏見，甚至加劇健康不平等。為此，作者提出EquityGuard框架，能偵測並減少這些不公平風險，實驗證明能讓不同族群獲得更公平的醫療建議。 PubMed DOI

A framework to assess clinical safety and hallucination rates of LLMs for medical text summarisation.
用於醫學文本摘要之大型語言模型（LLMs）臨床安全性與幻覺率評估框架 NPJ Digit Med 2025-05-13

這項研究提出一套新框架，能提升大型語言模型（LLM）生成臨床紀錄的準確性與安全性。透過錯誤分類、反覆評估、臨床安全性檢查和CREOLA介面，分析近1.3萬句臨床標註句子後，發現幻覺率1.47%、遺漏率3.45%。經優化後，重大錯誤率甚至比人類醫師還低，顯示這方法有助於提升LLM臨床應用的安全性。 PubMed DOI

Large Language Models in Medicine: Clinical Applications, Technical Challenges, and Ethical Considerations.
醫學中的大型語言模型：臨床應用、技術挑戰與倫理考量 Healthc Inform Res 2025-05-19

大型語言模型在醫療文件撰寫和決策輔助上很有潛力，但因準確性、驗證、偏見和隱私等問題，現階段還不適合完全自動化臨床應用。未來要安全有效導入，需加強研究、訂定明確規範，並維持人工監督。 PubMed DOI

Cognitive bias in clinical large language models.
臨床大型語言模型中的認知偏誤 NPJ Digit Med 2025-07-12

認知偏誤常讓醫療決策出錯，對病人造成傷害。大型語言模型（LLMs）進入臨床後，可能會延續甚至加劇這些偏誤，但也有機會用客觀數據協助減少錯誤。本文討論 LLMs 如何影響醫療決策中的認知偏誤，以及它們可能帶來的風險與助益。 PubMed DOI

Integrating large language models in biostatistical workflows for clinical and translational research.
將大型語言模型整合於臨床與轉譯研究的生物統計工作流程 J Clin Transl Sci 2025-07-16

調查發現，許多生物統計學家已用大型語言模型（LLMs）提升程式撰寫和寫作效率，但因錯誤和可靠性問題，仍需謹慎驗證。多數人希望有系統訓練和實用指引。研究也提出八大原則，協助生物統計學家負責任且有效運用LLMs。 PubMed DOI

原始文章

站上相關主題文章列表