Comparitive performance of artificial intelligence-based large language models on the orthopedic in-training examination.
人工智慧大型語言模型在骨科訓練考試中的比較表現。
J Orthop Surg (Hong Kong) 2025-03-03
ChatGPT's Performance on Portuguese Medical Examination Questions: Comparative Analysis of ChatGPT-3.5 Turbo and ChatGPT-4o Mini.
ChatGPT 在葡萄牙語醫學考試問題上的表現:ChatGPT-3.5 Turbo 與 ChatGPT-4o Mini 的比較分析。
JMIR Med Educ 2025-03-05
Evaluating the performance of GPT-3.5, GPT-4, and GPT-4o in the Chinese National Medical Licensing Examination.
GPT-3.5、GPT-4 與 GPT-4o 在中國國家醫師執照考試中的表現評估
Sci Rep 2025-04-24
The role of artificial intelligence in medical education: an evaluation of Large Language Models (LLMs) on the Turkish Medical Specialty Training Entrance Exam.
人工智慧在醫學教育中的角色:大型語言模型(LLMs)於土耳其醫學專科訓練入學考試的評估
BMC Med Educ 2025-04-25
Can ChatGPT-4o Really Pass Medical Science Exams? A Pragmatic Analysis Using Novel Questions.
ChatGPT-4o 真的能通過醫學科學考試嗎?以新穎試題進行的實用性分析
Med Sci Educ 2025-05-12
ChatGPT-4o 在英美醫師執照考試表現亮眼,即使遇到全新題目也能高分,證明不是只靠背題庫。不過,遇到圖片型選項時表現就變差。這說明單靠出新題或圖片題,無法完全防堵 AI 作弊,還是得有嚴格監考和安全措施,才能確保考試公平。
PubMedDOI
A Comparative Analysis of GPT-4o and ERNIE Bot in a Chinese Radiation Oncology Exam.
GPT-4o 與 ERNIE Bot 在中國放射腫瘤學考試中的比較分析
J Cancer Educ 2025-05-26
Evaluating Large Language Models for Enhancing Radiology Specialty Examination: A Comparative Study with Human Performance.
用於提升放射科專科考試的大型語言模型評估:與人類表現的比較研究
Acad Radiol 2025-05-28
Performance of DeepSeek-R1 and ChatGPT-4o on the Chinese National Medical Licensing Examination: A Comparative Study.
DeepSeek-R1 與 ChatGPT-4o 在中國國家醫師執照考試的表現:一項比較研究
J Med Syst 2025-06-03
Advancing medical AI: GPT-4 and GPT-4o surpass GPT-3.5 in Taiwanese medical licensing exams.
推進醫療 AI:GPT-4 與 GPT-4o 在台灣醫師國考中表現超越 GPT-3.5
PLoS One 2025-06-04
DeepSeek-R1 and GPT-4 are comparable in a complex diagnostic challenge: a historical control study.
DeepSeek-R1 與 GPT-4 在複雜診斷挑戰中的表現相當:一項歷史對照研究
Int J Surg 2025-06-12