Performance of large language models in the National Dental Licensing Examination in China: a comparative analysis of ChatGPT, GPT-4, and New Bing.
中國國家牙科執照考試中大型語言模型的表現:ChatGPT、GPT-4 和 New Bing 的比較分析。
Int J Comput Dent 2024-12-09
Accuracy of latest large language models in answering multiple choice questions in dentistry: A comparative study.
最新大型語言模型在牙科多選題回答中的準確性:一項比較研究。
PLoS One 2025-01-29
Evaluating the Performance of Large Language Models (LLMs) in Answering and Analysing the Chinese Dental Licensing Examination.
評估大型語言模型 (LLMs) 在回答和分析中國牙科執照考試中的表現。
Eur J Dent Educ 2025-01-31
Can a large language model create acceptable dental board-style examination questions? A cross-sectional prospective study.
大型語言模型能否創建可接受的牙科考試風格問題?一項橫斷面前瞻性研究。
J Dent Sci 2025-04-14
Accuracy, Consistency, and Contextual Understanding of Large Language Models in Restorative Dentistry and Endodontics.
大型語言模型在修復牙科與牙髓病學中的準確性、一致性與情境理解
J Dent 2025-04-17
A pilot study of the performance of Chat GPT and other large language models on a written final year periodontology exam.
Chat GPT 及其他大型語言模型於牙周病學畢業考筆試表現之初步研究
BMC Med Educ 2025-05-19
最新的語言模型(像 GPT-4o、ChatGPT-4)在牙周病學筆試的表現,已經超越大四牙醫學生,分數甚至接近頂尖學生。其他免費模型(如 Claude、DeepSeek、Gemini)也都比學生高分,其中以 Claude 最突出。不過,這些 AI 的答案有時會不正確或不完整,表現也會隨時間變動。雖然它們能幫助牙醫學習,但在醫療領域還是要謹慎使用。
PubMedDOI
Evaluating Large Language Models for Enhancing Radiology Specialty Examination: A Comparative Study with Human Performance.
用於提升放射科專科考試的大型語言模型評估:與人類表現的比較研究
Acad Radiol 2025-05-28