Comparison of the Usability and Reliability of Answers to Clinical Questions: AI-Generated ChatGPT versus a Human-Authored Resource.
臨床問題答案的可用性和可靠性比較：AI 生成的 ChatGPT 與人類撰寫的資源。 South Med J 2024-08-02

這項研究評估了ChatGPT對臨床問題的回答，與人類撰寫的網站Pearls4Peers.com進行比較，重點在可用性和可靠性。研究發現，ChatGPT的回答質量有顯著差異，約14%的回答被認為不實用，13%不準確。與人類來源相比，ChatGPT在可用性和可靠性方面的表現均不佳，超過30%的情況下表現不如人類。總體來看，這顯示在臨床決策中使用ChatGPT需謹慎。 PubMed DOI

Evaluating ChatGPT platform in delivering heart failure educational material: A comparison with the leading national cardiology institutes.
評估 ChatGPT 平台在提供心臟衰竭教育材料方面的表現：與主要國家心臟病學研究所的比較。 Curr Probl Cardiol 2024-08-19

您的研究強調病人教育在心臟衰竭管理中的重要性，並探討像ChatGPT這樣的AI聊天機器人的潛力。您比較了ChatGPT的回應與頂尖心臟病學機構的教育材料，評估了可讀性和可行性。研究發現，雖然ChatGPT的回應較長且複雜，但可讀性得分仍具競爭力。然而，其可行性得分較低，顯示資訊雖全面，但對病人來說應用不易。這項研究強調AI在病人教育中的潛力，但也指出需進一步研究以提升這些工具的可靠性和有效性，才能被認可為可信資源。整體而言，您的工作為技術與醫療教育的交集提供了重要見解。 PubMed DOI

Assessing ChatGPT's Accuracy and Reliability in Asthma General Knowledge: Implications for Artificial Intelligence Use in Public Health Education.
評估 ChatGPT 在哮喘一般知識中的準確性和可靠性：對人工智慧在公共健康教育中應用的啟示。 J Asthma 2025-01-08

這項研究評估了AI模型ChatGPT在提供有關哮喘的資訊準確性。醫療專業人員針對成人哮喘知識問卷評估其表現。結果顯示，ChatGPT在病因學和病理生理學方面表現優異，準確率達100%；但在藥物資訊方面僅有70%的準確率，與藥物相關的回答更低，只有30%。雖然ChatGPT在資訊一致性上表現良好，但在藥物資訊上仍需改進，顯示其作為哮喘教育工具的潛力。 PubMed DOI

A Cross-Sectional Study Comparing Patient Education Guides Created by ChatGPT and Google Gemini for Common Cardiovascular-Related Conditions.
比較 ChatGPT 和 Google Gemini 為常見心血管相關疾病所製作的病患教育指南的橫斷面研究。 Cureus 2025-02-17

本研究探討了ChatGPT和Google Gemini兩個人工智慧工具在創建有關肥胖、高血壓和高三酸甘油脂血症的患者教育指南的有效性。結果顯示，ChatGPT生成的內容較長，但在可讀性和可靠性上與Google Gemini相似。雖然Google Gemini的易讀性得分稍高，但差異不顯著。總體而言，這兩個工具都能有效滿足患者的教育需求，適應不同的內容長度和複雜度。 PubMed DOI

A cross-sectional study to evaluate responses generated by two AI software programs for common patient queries about laparoscopic repair of inguinal hernia.
一項橫斷面研究評估兩個 AI 軟體程序對於關於腹腔鏡修補腹股溝疝氣的常見病人詢問所產生的回應。 Updates Surg 2025-03-05

這項研究評估了兩個AI聊天機器人，ChatGPT和ChatSonic，針對腹腔鏡修補腹股溝疝氣的問題所提供的回答質量。研究者提出十個問題，並由兩位外科醫生使用全球質量評分（GQS）和修改版的DISCERN評分來評估。結果顯示，ChatGPT的回答質量較高，獲得了良好的評分，而ChatSonic的表現稍遜。雖然兩者都有潛力，但在可靠性和質量上的不一致性，顯示在臨床使用前仍需進一步驗證。 PubMed DOI

Advancing personalized medicine in digital health: The role of artificial intelligence in enhancing clinical interpretation of 24-h ambulatory blood pressure monitoring.
推進數位健康中的個人化醫療：人工智慧在增強24小時動態血壓監測臨床解讀中的角色。 Digit Health 2025-03-17

本研究探討了ChatGPT 4.0在解讀動態血壓監測（ABPM）數據的準確性，與兩位腎臟科醫生的解讀結果進行比較。分析了53份ABPM記錄，結果顯示ChatGPT在高血壓識別、夜間高血壓及異常心率等方面的準確性分別為87%、89%及94%。兩輪測試的協議率顯示出中等到顯著的一致性，且準確性在兩次測試中無顯著差異。這表明ChatGPT在高血壓管理中具潛力，但仍需在更大樣本中進一步驗證。 PubMed DOI

A Heart-to-heart with ChatGPT: AI Applications in Hypertension.
與 ChatGPT 的心靈對話：高血壓中的 AI 應用。 Am J Hypertens 2025-04-03

高血壓對心血管疾病和早逝影響深遠，但許多相關問題仍不明朗。雖然有多種藥物可用，仍有病人難以控制血壓，這通常與疾病多樣性及其他健康問題有關。隨著醫療數據的激增，人工智慧（AI）提供了新的機會，特別是在大型數據集的模式識別上。這篇綜述探討了AI如何改變高血壓的臨床實踐、病人照護及醫學教育，並強調了ChatGPT在數據分析、決策支持和病人教育上的潛力，可能會改變高血壓的研究、診斷和治療方式。 PubMed DOI

Evaluating ChatGPT-4's correctness in patient-focused informing and awareness for atrial fibrillation.
評估 ChatGPT-4 在心房顫動患者導向資訊與意識方面的正確性。 Heart Rhythm O2 2025-04-14

這項研究評估了OpenAI的ChatGPT-4在提供心房顫動相關資訊的準確性。研究使用108個結構化問題，涵蓋治療選擇和生活方式調整，由三位心臟科醫師根據準確性、清晰度和臨床相關性評估其回答。結果顯示，ChatGPT-4在「生活方式調整」和「日常生活與管理」表現良好，但在較複雜的問題上則表現不佳。整體而言，雖然它在簡單主題上有潛力，但對於需要深入臨床見解的複雜問題仍有局限。 PubMed DOI

Assessing the Quality and Reliability of ChatGPT's Responses to Radiotherapy-Related Patient Queries: Comparative Study With GPT-3.5 and GPT-4.
ChatGPT 回應放射治療相關病患問題的品質與可靠性評估：與 GPT-3.5 及 GPT-4 的比較研究 JMIR Cancer 2025-04-16

這項研究發現，GPT-4在回答放射治療常見問題時，比GPT-3.5表現更好，但兩者的回答對一般人來說還是太難懂，也有可能出現錯誤資訊。建議在正式用於病人前，還需要加強內容的易讀性和正確性。 PubMed DOI

Evaluating the Reliability and Quality of Sarcoidosis-Related Information Provided by AI Chatbots.
AI 聊天機器人所提供有關 Sarcoidosis 資訊之可靠性與品質評估 Healthcare (Basel) 2025-06-13

這項研究發現，採用檢索增強技術的AI聊天機器人（如ChatGPT-4o Deep Research等）在提供結節病資訊時，比一般AI更準確可靠。不過，他們的回答多半太艱深，病人不易看懂，而且給的實際建議也不夠明確。整體來說，AI雖然能提供高品質資訊，但在易讀性和實用性上還有進步空間。 PubMed DOI

原始文章

站上相關主題文章列表