這項研究評估了四個人工智慧模型在土耳其牙科專業入學考試中的表現,包括ChatGPT-3.5、ChatGPT-4 Omni、Google Bard和Microsoft Copilot,針對口腔放射學的多選題進行分析。研究涵蓋了2012至2021年的123道題目。結果顯示,ChatGPT-4 Omni的準確率最高,達86.1%,其次是Google Bard的61.8%。而ChatGPT-3.5和Microsoft Copilot的準確率則較低,分別為43.9%和41.5%。這顯示ChatGPT-4 Omni在推理能力上更為優越,對醫療專業人員和公眾來說是個重要的教育資源。
PubMed
DOI