Performance of DeepSeek-R1 and ChatGPT-4o on the Chinese National Medical Licensing Examination: A Comparative Study.
DeepSeek-R1 與 ChatGPT-4o 在中國國家醫師執照考試的表現:一項比較研究
J Med Syst 2025-06-03
Influence of Model Evolution and System Roles on ChatGPT's Performance in Chinese Medical Licensing Exams: Comparative Study.
模型演變與系統角色對 ChatGPT 在中國醫學執照考試中表現的影響:比較研究。
JMIR Med Educ 2024-08-14
Performance of ChatGPT and Bard on the medical licensing examinations varies across different cultures: a comparison study.
ChatGPT 和 Bard 在醫學執照考試中的表現因文化差異而異:比較研究。
BMC Med Educ 2024-11-26
Performance of large language models in the National Dental Licensing Examination in China: a comparative analysis of ChatGPT, GPT-4, and New Bing.
中國國家牙科執照考試中大型語言模型的表現:ChatGPT、GPT-4 和 New Bing 的比較分析。
Int J Comput Dent 2024-12-09
Evaluating the Performance of Large Language Models (LLMs) in Answering and Analysing the Chinese Dental Licensing Examination.
評估大型語言模型 (LLMs) 在回答和分析中國牙科執照考試中的表現。
Eur J Dent Educ 2025-01-31
While GPT-3.5 is unable to pass the Physician Licensing Exam in Taiwan, GPT-4 successfully meets the criteria.
雖然 GPT-3.5 無法通過台灣的醫師執照考試,但 GPT-4 成功符合標準。
J Chin Med Assoc 2025-03-14
Evaluating the performance of GPT-3.5, GPT-4, and GPT-4o in the Chinese National Medical Licensing Examination.
GPT-3.5、GPT-4 與 GPT-4o 在中國國家醫師執照考試中的表現評估
Sci Rep 2025-04-24
Large language model comparisons between English and Chinese query performance for cardiovascular prevention.
英語與中文查詢在心血管預防領域中大型語言模型表現之比較
Commun Med (Lond) 2025-05-16
DeepSeek vs ChatGPT: a comparison study of their performance in answering prostate cancer radiotherapy questions in multiple languages.
DeepSeek 與 ChatGPT:多語言前列腺癌放射治療問答表現之比較研究
Am J Clin Exp Urol 2025-05-22
這項研究發現,DeepSeek 在用中文回答前列腺癌放射治療問題時,表現明顯優於 ChatGPT,尤其在基礎知識和治療照護方面更突出;但用英文時,兩者差異不大。這顯示選擇語言優化的 AI 模型很重要,但專家審查仍不可或缺。
PubMedDOI
A Comparative Analysis of GPT-4o and ERNIE Bot in a Chinese Radiation Oncology Exam.
GPT-4o 與 ERNIE Bot 在中國放射腫瘤學考試中的比較分析
J Cancer Educ 2025-05-26