Utilizing ChatGPT in clinical research related to anesthesiology: a comprehensive review of opportunities and limitations.
在麻醉學臨床研究中利用 ChatGPT：機會與限制的全面回顧。 Anesth Pain Med (Seoul) 2023-09-13

ChatGPT是OpenAI研發的聊天機器人，可以像人一樣回答問題。它使用Transformer技術的GPT語言模型。雖然有助於研究和校對英文寫作，但因AI幻覺和數據限制，臨床應用仍受限。在科學寫作中，擔心原創性和抄襲問題，建議謹慎使用ChatGPT。法規和討論仍在進行中。 PubMed DOI

Utilizing Artificial Intelligence and Chat Generative Pretrained Transformer to Answer Questions About Clinical Scenarios in Neuroanesthesiology.
運用人工智慧和聊天生成預訓練轉換器回答神經麻醉臨床情境問題。 J Neurosurg Anesthesiol 2023-12-21

研究發現ChatGPT在回答神經麻醉和重症護理問題時，僅提供部分有用建議，甚至可能有害建議。醫師們認為ChatGPT需要人類解釋，且不適用於臨床決策。未來改進或許可提升其臨床資訊準確性，但目前仍需謹慎使用。 PubMed DOI

[ChatGPT for use in technology-enhanced learning in anesthesiology and emergency medicine and potential clinical application of AI language models : Between hype and reality around artificial intelligence in medical use].
麻醉學和急診醫學中使用 ChatGPT 的技術增強學習，以及 AI 語言模型在臨床應用的潛在可能性：圍繞醫療人工智慧應用的熱潮與現實之間。 Anaesthesiologie 2024-05-01

人工智慧語言模型被研究應用在教育、學術和臨床領域，顯示可解答醫學問題，對醫學教育有幫助。研究發現ChatGPT在回答問題上表現準確，但在生成文章時有錯誤。雖然在醫療上有潛力，但仍需監督因應潛在錯誤和能力限制。 PubMed DOI

Comparison of artificial intelligence large language model chatbots in answering frequently asked questions in anaesthesia.
人工智慧大型語言模型聊天機器人在麻醉常見問題回答中的比較。 BJA Open 2024-05-20

根據專家評估其回答，AI聊天機器人如ChatGPT4和Bard在回答麻醉常見問題時表現優於Bing Chat。儘管這些聊天機器人在溝通品質方面表現出色，但在醫學內容品質方面則有所不足。在這個情況下，ChatGPT4和Bard被發現在這方面與Bing Chat相比是可比且優越的。 PubMed DOI

Analyzing Large Language Models' Responses to Common Lumbar Spine Fusion Surgery Questions: A Comparison Between ChatGPT and Bard.
分析大型語言模型對常見腰椎融合手術問題的回答：ChatGPT 和 Bard 的比較。 Neurospine 2024-07-02

研究比較OpenAI的ChatGPT 3.5和Google的Bard在回答腰椎融合手術問題時的表現，結果顯示兩者回答品質高，但在手術風險、成功率和手術方法等特定問題上表現較差。評分者間一致性不高，Bard在同理心和專業性方面稍遜。未來需加強大型語言模型在醫學教育和醫療溝通的應用。 PubMed DOI

A comparative study of English and Japanese ChatGPT responses to anaesthesia-related medical questions.
英文和日文 ChatGPT 對麻醉相關醫學問題回答的比較研究。 BJA Open 2024-07-08

研究比較了ChatGPT在英文和日文對麻醉學問題的回應品質，英文回答在準確性、全面性、安全性、理解力、同理心和道德等方面優於日文。結果顯示不同語言的人工智慧表現有差異，強調改善少數語言的醫療人工智慧回應的重要性。 PubMed DOI

Evaluation of the quality and quantity of artificial intelligence-generated responses about anesthesia and surgery: using ChatGPT 3.5 and 4.0.
評估人工智慧生成的有關麻醉和手術的回應質量和數量：使用 ChatGPT 3.5 和 4.0。 Front Med (Lausanne) 2024-07-26

這項研究評估了ChatGPT在麻醉程序中的醫療回應，特別是比較了3.5和4.0兩個版本。麻醉醫師提出30個病人相關問題，31位麻醉醫師用5點李克特量表評估回應。結果顯示，兩個版本的回應質量均為「適當」，但4.0版本的「足夠」回應比例高於3.5，後者常被評為「不足」。整體來看，4.0在質量、數量和整體評估上均優於3.5，顯示出顯著改善。研究指出，4.0版本的回應質量更佳，顯示AI在醫療問題解答上的潛力，建議進一步研究其實用性。 PubMed DOI

The evaluation of the performance of ChatGPT in the management of labor analgesia.
ChatGPT 在分娩鎮痛管理中的表現評估。 J Clin Anesth 2024-08-21

一項研究評估了ChatGPT4在產科麻醉臨床決策中的表現，測試了八個不同的情境。七位專業麻醉醫師使用五點李克特量表評估其回應。結果顯示，73%的回應被認為是安全的，但沒有一個回應獲得所有專家的一致認可。準確性評為部分準確（4分），完整性則為有些不完整（3.5分）。約25%的回應被視為不安全，顯示大型語言模型在醫療領域仍需進一步訓練與調整，未來可能對產科麻醉的臨床決策有所幫助。 PubMed DOI

An Exploratory Analysis of ChatGPT Compared to Human Performance With the Anesthesiology Oral Board Examination: Initial Insights and Implications.
對於麻醉學口試考試中 ChatGPT 與人類表現的探索性分析：初步見解與啟示。 Anesth Analg 2024-09-13

一項研究比較了麻醉學研究員與ChatGPT在美國麻醉學委員會標準化口試中的表現。雖然研究員在某些主題上得分較高，但整體得分差異不大。考官能輕易辨識ChatGPT的回答，並指出其回答通常冗長且缺乏重點，雖然內容相關。研究顯示，ChatGPT的答案在評分上相當，但因冗長和不夠具體而被視為較劣。這項研究指出，隨著進一步訓練，像ChatGPT的人工智慧有潛力成為麻醉學訓練和考試準備的有用工具。 PubMed DOI

Performance of ChatGPT in the In-Training Examination for Anesthesiology and Pain Medicine Residents in South Korea: Observational Study.
南韓麻醉學與疼痛醫學住院醫師在訓練考試中 ChatGPT 的表現：觀察性研究。 JMIR Med Educ 2024-09-16

這項研究評估了ChatGPT在麻醉學和疼痛醫學的問題解決能力，特別是在韓語環境中，並比較了GPT-4、GPT-3.5和CLOVA X的表現。分析了398道問題後發現，GPT-4的準確率（67.8%）顯著高於GPT-3.5（37.2%）和CLOVA X（36.7%），而後兩者之間無顯著差異。此外，GPT-4在英語翻譯問題上的表現（75.4%）也優於韓語問題。研究強調了AI在醫學教育的潛力，但也提醒在非英語環境中應用時需謹慎，並建議進一步改進。 PubMed DOI

原始文章

站上相關主題文章列表