A Clinical Evaluation of Cardiovascular Emergencies: A Comparison of Responses from ChatGPT, Emergency Physicians, and Cardiologists.
心血管急症的臨床評估：ChatGPT、急診醫師與心臟科醫師反應的比較。 Diagnostics (Basel) 2024-12-17

這項研究評估了ChatGPT-4o在急性心臟病案例中的表現，並與心臟科醫生和急診醫生進行比較。結果顯示，ChatGPT-4o和心臟科醫生的準確性均達100%，而急診醫生較低。ChatGPT-4o反應最快，且在準確性和完整性上得分最高。研究顯示，ChatGPT-4o的表現優於人類醫生，顯示其在臨床決策支持上的潛力，但人類監督仍然對安全整合AI進醫療至關重要。 PubMed DOI

Comparison of the performances between ChatGPT and Gemini in answering questions on viral hepatitis.
ChatGPT 與 Gemini 在回答病毒性肝炎問題上的表現比較。 Sci Rep 2025-01-11

這項研究首次評估了ChatGPT和Gemini聊天機器人在提供病毒性肝炎資訊的準確性與可靠性。研究共分析176個問題，結果顯示兩者的平均分數相近（3.55對3.57），且正確回答比例也相似（71.0%對78.4%）。在CDC問題上，兩者的正確率都很高，但在國際指導方針問題上則表現不佳。整體而言，雖然在CDC和社交媒體問題上表現良好，但在指導方針的準確性上仍有待加強。 PubMed DOI

Evaluating AI Chatbot Responses to Postkidney Transplant Inquiries.
評估 AI 聊天機器人對腎臟移植後詢問的回應。 Transplant Proc 2025-01-15

這項研究評估了三款AI聊天機器人—ChatGPT 4.0、Claude 3.0和Gemini Pro—以及Google在回答腎臟移植後常見問題的表現。研究使用5點李克特量表評估回應質量，並透過病人教育材料評估工具（PEMAT）檢視可理解性和可行性。結果顯示，回應質量高（中位分數4），可理解性良好（中位72.7%），但可行性較差（中位20%）。可讀性較難，Claude 3.0提供最可靠的回應，而ChatGPT 4.0則在可理解性上表現突出。Google在各項指標上未能超越這些聊天機器人。 PubMed DOI

Assessing the knowledge of ChatGPT and Google Gemini in answering peripheral artery disease-related questions.
評估 ChatGPT 和 Google Gemini 在回答周邊動脈疾病相關問題的知識。 Vascular 2025-01-21

這項研究比較了ChatGPT和Google Gemini在回答周邊動脈疾病（PAD）相關問題的表現。共評估72個常見問題和63個基於歐洲心臟病學會指導方針的問題。結果顯示，ChatGPT在準確性和滿意度上優於Google Gemini，分別有70.8%和69.8%的回答獲得最高評分GQS 5，而Google Gemini則為55.6%和50.8%。不過，Google Gemini的回應速度較快。總體來看，ChatGPT在準確性和滿意度上表現更佳。 PubMed DOI

A Cross-Sectional Study Comparing Patient Education Guides Created by ChatGPT and Google Gemini for Common Cardiovascular-Related Conditions.
比較 ChatGPT 和 Google Gemini 為常見心血管相關疾病所製作的病患教育指南的橫斷面研究。 Cureus 2025-02-17

本研究探討了ChatGPT和Google Gemini兩個人工智慧工具在創建有關肥胖、高血壓和高三酸甘油脂血症的患者教育指南的有效性。結果顯示，ChatGPT生成的內容較長，但在可讀性和可靠性上與Google Gemini相似。雖然Google Gemini的易讀性得分稍高，但差異不顯著。總體而言，這兩個工具都能有效滿足患者的教育需求，適應不同的內容長度和複雜度。 PubMed DOI

Comparative analysis of ChatGPT and Gemini (Bard) in medical inquiry: a scoping review.
醫學查詢中 ChatGPT 與 Gemini (Bard) 的比較分析：範疇回顧。 Front Digit Health 2025-02-18

這篇回顧評估了AI聊天機器人ChatGPT和Gemini在醫療應用中的準確性與回應長度，基於2023年1月到10月的研究。從64篇論文中，11篇符合標準，涉及1,177個樣本。結果顯示，ChatGPT在準確性上普遍優於Gemini，尤其在放射學方面（87.43%對71%），且回應較短（907字元對1,428字元）。不過，Gemini在緊急情況和腎臟健康飲食詢問上表現不錯。統計分析顯示，ChatGPT在準確性和回應長度上均顯著優於Gemini，建議在醫療詢問中使用ChatGPT可能更有效。 PubMed DOI

Artificial intelligence in healthcare education: evaluating the accuracy of ChatGPT, Copilot, and Google Gemini in cardiovascular pharmacology.
醫療教育中的人工智慧：評估 ChatGPT、Copilot 和 Google Gemini 在心血管藥理學中的準確性。 Front Med (Lausanne) 2025-03-06

這項研究分析了三種生成式人工智慧工具—ChatGPT-4、Copilot 和 Google Gemini—在心血管藥理學問題上的表現。研究使用了45道多選題和30道短答題，並由專家評估AI生成的答案準確性。結果顯示，這三種AI在簡單和中等難度的多選題上表現良好，但在高難度題目上表現不佳，特別是Gemini。ChatGPT-4在所有題型中表現最佳，Copilot次之，而Gemini則需改進。這些結果顯示AI在醫學教育中的潛力與挑戰。 PubMed DOI

Evaluating ChatGPT-4's correctness in patient-focused informing and awareness for atrial fibrillation.
評估 ChatGPT-4 在心房顫動患者導向資訊與意識方面的正確性。 Heart Rhythm O2 2025-04-14

這項研究評估了OpenAI的ChatGPT-4在提供心房顫動相關資訊的準確性。研究使用108個結構化問題，涵蓋治療選擇和生活方式調整，由三位心臟科醫師根據準確性、清晰度和臨床相關性評估其回答。結果顯示，ChatGPT-4在「生活方式調整」和「日常生活與管理」表現良好，但在較複雜的問題上則表現不佳。整體而言，雖然它在簡單主題上有潛力，但對於需要深入臨床見解的複雜問題仍有局限。 PubMed DOI

Evaluation of AI-Based Chatbots in Liver Cancer Information Dissemination: A Comparative Analysis of GPT, DeepSeek, Copilot, and Gemini.
AI 聊天機器人在肝癌資訊傳播中的評估：GPT、DeepSeek、Copilot 與 Gemini 之比較分析 Oncology 2025-06-10

這項研究比較四款免費AI聊天機器人回答肝癌相關問題的表現，發現它們雖然能提供大致正確且無偏見的資訊，但在資料來源、治療細節和說明清楚度上有差異。AI回答可作為參考，但仍需專業醫師把關，不能取代醫療建議。 PubMed DOI

Artificial Intelligence in Peripheral Artery Disease Education: A Battle Between ChatGPT and Google Gemini.
周邊動脈疾病教育中的人工智慧：ChatGPT 與 Google Gemini 的對決 Cureus 2025-07-02

這項研究比較ChatGPT和Google Gemini在回答周邊動脈疾病常見問題時的表現。結果顯示，ChatGPT的正確率較高，且沒有明顯錯誤，Gemini則有部分錯誤答案。兩者的回答都偏難讀，不太符合病人衛教建議的閱讀程度。雖然AI能協助病人獲取正確資訊，但內容還需優化，讓病人更容易看懂。未來應加強AI健康資訊的可讀性與實際應用成效。 PubMed DOI

原始文章

站上相關主題文章列表