這項研究評估了多種人工智慧模型在日本國家牙科考試中的表現,包括 ChatGPT 3.5、ChatGPT 4o mini 和 Gemini。分析了過去五年中 400 道必考題的 349 道,結果顯示 ChatGPT 4o mini 的表現最佳,達到兩年的及格標準,並獲得最高總分。在「社會與牙科」和「主要徵兆」類別中,ChatGPT 4o mini 明顯優於 ChatGPT 3.5。研究顯示,ChatGPT 4o mini 在牙科教育上有很大潛力,提升其能力可能對臨床應用有幫助。
PubMed
DOI