Investigating the impact of innovative AI chatbot on post-pandemic medical education and clinical assistance: a comprehensive analysis.
探討創新人工智慧聊天機器人對後疫情醫學教育和臨床協助的影響：全面分析。 ANZ J Surg 2024-02-27

研究發現三款大型語言模型在醫療決策上的表現，ChatGPT最優，其次是Google的Bard和Bing的AI。結果顯示ChatGPT提供更易懂且符合指引的醫療建議，對初級醫生學習和臨床決策有潛力，但還需更多整合到教育中。 PubMed DOI

A Systematic Review of ChatGPT and Other Conversational Large Language Models in Healthcare.
ChatGPT和其他醫療對話型大型語言模型的系統性回顧。 medRxiv 2024-05-07

2022年11月，ChatGPT推出後受到人們對大型語言模型（LLMs）在各領域的興趣，尤其是醫療保健的關注。綜述了65篇研究文章，探討對話式LLMs在醫療保健中的應用和關注點。大部分研究聚焦在摘要和醫學知識查詢，強調可靠性和偏見問題。雖然LLMs在提供準確資訊方面有潛力，但在複雜健康任務上仍有挑戰。未來研究需加強LLMs在醫療保健中的可靠性，解決偏見和隱私問題。在運用LLMs於醫療保健上，法律、社會和技術層面的努力至關重要。 PubMed DOI

Systematic review: The use of large language models as medical chatbots in digestive diseases.
系統性回顧：在消化系統疾病中使用大型語言模型作為醫學聊天機器人的應用。 Aliment Pharmacol Ther 2024-05-27

使用大型語言模型如OpenAI的ChatGPT提供胃腸肝臟疾病醫療建議的趨勢增加，但目前準確性仍有疑慮。研究指出，這些模型在胃腸肝臟疾病領域的回應準確率偏低，可能帶來安全風險，因為提供錯誤資訊可能對醫療系統造成負擔或延誤治療。 PubMed DOI

The ethics of ChatGPT in medicine and healthcare: a systematic review on Large Language Models (LLMs).
ChatGPT在醫學與醫療領域的倫理：關於大型語言模型（LLMs）的系統性回顧。 NPJ Digit Med 2024-07-08

大型語言模型（LLMs）如ChatGPT在醫療上有好處，但也引起道德疑慮。研究探討了LLMs在醫學上的道德議題，提到了優點如數據分析和決策支持，也指出了公平性、偏見和隱私等疑慮。強調在醫療上使用LLMs時，需要道德指導、人類監督和批判性評估。 PubMed DOI

Generative Large Language Models in Electronic Health Records for Patient Care Since 2023: A Systematic Review.
2023年以來生成大型語言模型在電子健康紀錄中的病患照護：系統性回顧。 medRxiv 2024-09-04

這項研究系統性回顧了生成性大型語言模型（LLMs）在臨床環境，特別是電子健康紀錄（EHRs）的應用。儘管自然語言處理技術進步，LLMs在臨床實踐中的整合仍有限，面臨多重挑戰。研究分析了自2023年以來的76篇相關文獻，發現包括提示工程的使用、少數多模態數據的應用、評估指標的多樣性，以及臨床決策中的偏見和幻覺等問題。未來需改進計算技術和標準化評估，以提升LLMs在醫療中的可靠性。總之，LLMs在病人護理上有潛力，但仍需克服重大障礙。 PubMed DOI

Accuracy of Prospective Assessments of 4 Large Language Model Chatbot Responses to Patient Questions About Emergency Care: Experimental Comparative Study.
大型語言模型聊天機器人對患者急救問題的前瞻性評估準確性：實驗比較研究。 J Med Internet Res 2024-11-04

最近調查顯示，48%的消費者使用生成式AI查詢健康資訊，但對於AI聊天機器人在緊急護理建議的回應質量研究仍然不足。一項針對四款免費AI聊天機器人的研究發現，雖然它們在清晰度和可理解性上表現良好，但準確性和來源可靠性卻相當低。危險信息的出現率在5%到35%之間，且各機器人之間差異不大。研究建議應加強對AI聊天機器人的研究與規範，並強調諮詢醫療專業人員的重要性，以避免潛在風險。 PubMed DOI

Applications and Concerns of ChatGPT and Other Conversational Large Language Models in Health Care: Systematic Review.
ChatGPT 及其他對話式大型語言模型在醫療保健中的應用與關注：系統性回顧。 J Med Internet Res 2024-11-07

這篇評論探討了對話式大型語言模型（LLMs）在醫療保健的應用及其相關問題，特別是在2022年11月ChatGPT推出後的情況。總結了截至2023年9月1日的65篇經過同行評審的研究，主要來自PubMed、ACM和IEEE等資料庫。研究多集中於ChatGPT，應用範疇包括摘要、醫學知識查詢等。評論指出的擔憂有可靠性、偏見、隱私及公眾接受度。雖然LLMs在摘要和一般醫學知識上有潛力，但在複雜任務上表現不佳。未來研究應加強LLMs的可靠性，並探討偏見和隱私問題的根源，強調需有法律、社會及技術措施來解決這些挑戰。 PubMed DOI

Current applications and challenges in large language models for patient care: a systematic review.
大型語言模型在病患照護中的現行應用與挑戰：系統性回顧。 Commun Med (Lond) 2025-01-21

大型語言模型（LLMs）在臨床實踐中有潛力提升病人教育與賦權，提供更個人化的醫療服務。然而，目前對其在病人照護中的應用資訊仍不夠完整。本系統性回顧分析了2022至2023年間的89項相關研究，主要集中於GPT-3.5和GPT-4，應用於回答醫療問題、生成病人資訊等。研究指出設計和輸出方面的限制，包括缺乏針對醫療的優化及數據透明度等問題。此回顧為LLMs在醫療環境中的應用與評估提供了基礎框架。 PubMed DOI

Generative AI chatbots for reliable cancer information: Evaluating web-search, multilingual, and reference capabilities of emerging large language models.
生成式 AI 聊天機器人提供可靠癌症資訊：評估新興大型語言模型的網路搜尋、多語言及參考能力。 Eur J Cancer 2025-02-08

最近大型語言模型（LLMs）在即時搜尋和多語言支持上有了顯著進展，但提供健康資訊的安全性仍然很重要。針對七個公開的LLMs進行的評估顯示，英語回應中沒有臨床錯誤，但294個非英語回應中有7個出現錯誤。雖然48%的回應有有效引用，但39%的英語引用來自.com網站，質量堪憂。此外，英語回應的閱讀水平普遍較高，非英語回應也相對複雜。這些結果顯示LLMs在準確性和可讀性上仍需改進，持續的基準測試是必要的。 PubMed DOI

A systematic review of large language model (LLM) evaluations in clinical medicine.
大型語言模型 (LLM) 在臨床醫學評估中的系統性回顧。 BMC Med Inform Decis Mak 2025-03-07

大型語言模型（LLMs）在臨床醫學中展現出潛力，能改善決策支持、診斷及醫學教育。不過，將其整合進臨床流程需徹底評估，以確保可靠性、安全性及倫理性。本系統性回顧調查了LLMs在臨床環境中的評估方法，發現大多數研究集中於一般領域的LLMs，醫學領域的研究較少。準確性是最常評估的參數。儘管對LLMs的興趣上升，研究中仍存在限制與偏見，未來需建立標準化框架，確保其安全有效地應用於臨床實踐。 PubMed DOI

原始文章

站上相關主題文章列表