Evaluating the Potential of Large Language Models for Vestibular Rehabilitation Education: A Comparison of ChatGPT, Google Gemini, and Clinicians.
評估大型語言模型在前庭康復教育中的潛力:ChatGPT、Google Gemini 與臨床醫師的比較。
Phys Ther 2025-02-11
Quality of Information Provided by Artificial Intelligence Chatbots Surrounding the Management of Vestibular Schwannomas: A Comparative Analysis Between ChatGPT-4 and Claude 2.
人工智慧聊天機器人提供的有關前庭神經瘤管理的資訊質量:ChatGPT-4 與 Claude 2 的比較分析。
Otol Neurotol 2025-02-18
這項研究評估了兩個人工智慧平台,ChatGPT-4 和 Claude 2,對前庭神經瘤管理資訊的品質。由19位側顱底外科醫生組成的評估小組使用醫療人工智慧品質評估問卷(QAMAI)來檢視36個問題的回答。結果顯示,ChatGPT-4在38.9%的問題上表現優於Claude 2,而Claude 2僅在5.6%的問題上得分較高。雖然ChatGPT-4在大多數方面表現較佳,但兩者在提供準確資訊上仍有困難,顯示患者使用這些工具時面臨錯誤資訊的風險。
PubMedDOI
Artificial intelligence (ChatGPT 4.0) vs. Human expertise for epileptic seizure and epilepsy diagnosis and classification in Adults: An exploratory study.
人工智慧 (ChatGPT 4.0) 與人類專業在成人癲癇發作及癲癇診斷與分類中的比較:一項探索性研究。
Epilepsy Behav 2025-03-13
Ability of ChatGPT to Replace Doctors in Patient Education: Cross-Sectional Comparative Analysis of Inflammatory Bowel Disease.
ChatGPT 在病人教育中取代醫生的能力:炎症性腸病的橫斷面比較分析。
J Med Internet Res 2025-03-31
Evaluating advanced AI reasoning models: ChatGPT-4.0 and DeepSeek-R1 diagnostic performance in otolaryngology: a comparative analysis.
進階 AI 推理模型於耳鼻喉科診斷表現之評估:ChatGPT-4.0 與 DeepSeek-R1 的比較分析
Am J Otolaryngol 2025-05-14
Comparative evaluation of the accuracy and reliability of ChatGPT versions in providing information on <i>Helicobacter pylori</i> infection.
ChatGPT 各版本在提供有關 Helicobacter pylori 感染資訊之準確性與可靠性的比較評估
Front Public Health 2025-05-30