Performance of ChatGPT, GPT-4, and Google Bard on a Neurosurgery Oral Boards Preparation Question Bank.
ChatGPT、GPT-4 和 Google Bard 在神經外科口試準備問題庫上的表現。
Neurosurgery 2024-02-21
Comparative performance of humans versus GPT-4.0 and GPT-3.5 in the self-assessment program of American Academy of Ophthalmology.
人類與 GPT-4.0 及 GPT-3.5 在美國眼科學會自我評估計畫中的比較表現。
Sci Rep 2023-11-01
Comprehensive analysis of the performance of GPT-3.5 and GPT-4 on the American Urological Association self-assessment study program exams from 2012-2023.
2012年至2023年美國泌尿學會自我評估研究計畫考試中GPT-3.5和GPT-4表現的全面分析。
Can Urol Assoc J 2024-02-21
Performance of GPT-4V in Answering the Japanese Otolaryngology Board Certification Examination Questions: Evaluation Study.
GPT-4V在回答日本耳鼻喉科醫師專科醫師認證考試問題中的表現:評估研究。
JMIR Med Educ 2024-03-29
Comparative Performance of ChatGPT 3.5 and GPT4 on Rhinology Standardized Board Examination Questions.
ChatGPT 3.5 和 GPT4 在鼻科標準化考試問題上的比較表現。
OTO Open 2024-06-28
Advancing Medical Education: Performance of Generative Artificial Intelligence Models on Otolaryngology Board Preparation Questions With Image Analysis Insights.
推進醫學教育:生成式人工智慧模型在耳鼻喉科考試準備問題上的表現及影像分析見解。
Cureus 2024-08-12
這項研究評估了三個人工智慧模型—ChatGPT、GPT-4 和 Google Bard—在美國耳鼻喉科考試問題上的表現,分析了1,077道文字題和60道圖片題。結果顯示,GPT-4的表現最佳,得分78.7%,而ChatGPT和Bard分別為55.3%和61.7%(p<0.001)。所有模型在簡單問題上表現較好,GPT-4在各子專科得分也較高,僅過敏科差異不顯著。雖然GPT-4表現良好,但在醫學教育和病人護理中的應用仍需謹慎。
PubMedDOI
Performance Evaluation of the Generative Pre-trained Transformer (GPT-4) on the Family Medicine In-Training Examination.
Generative Pre-trained Transformer (GPT-4) 在家庭醫學訓練考試中的表現評估。
J Am Board Fam Med 2024-08-30
Is ChatGPT 3.5 smarter than Otolaryngology trainees? A comparison study of board style exam questions.
ChatGPT 3.5 是否比耳鼻喉科實習生更聰明?一項關於考試題型的比較研究。
PLoS One 2024-09-26