原始文章

這項研究發現,牙醫系學生在牙齒解剖學選擇題考試的表現優於ChatGPT,學生平均分數74.28%,ChatGPT則為60%。雖然ChatGPT有基本理解力,能及格,但準確度和可靠性還是不夠,所以不建議單靠它來學牙齒解剖學。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT 3.5和4.0在提供創傷性牙齒損傷資訊上的表現,針對40個問題進行分析。主要發現包括:ChatGPT 3.5的原創回應較多,且可讀性稍好(FRES得分39.732),而4.0在定義和診斷的質量上表現較佳。雖然兩者在可讀性和可靠性上有挑戰,但仍提供高質量資訊,建議作為牙科教育的輔助資源。 PubMed DOI

這項研究評估了ChatGPT-4.0和Gemini Advanced在2020及2021年土耳其牙科專業考試的表現。結果顯示,ChatGPT-4.0的正確回答率高於Gemini Advanced,2020年為83.3%對65%,2021年為80.5%對60.2%。雖然兩者都通過考試,但分數仍低於最佳人類考生。特別是在基礎科學和臨床科學方面表現不佳,只有在牙周病學上較為突出。總體而言,這些AI聊天機器人的表現未達最佳考生水準。 PubMed DOI

這項研究評估了兩個版本的ChatGPT—ChatGPT-4和ChatGPT-4o—在本科牙髓學教育的多選題回答準確性。共提出60個問題,結果顯示ChatGPT-4o的準確率為92.8%,明顯高於ChatGPT-4的81.7%,且p值小於0.001。雖然問題組影響準確率,但一天中的時間對兩者無影響。兩個模型的一致性無顯著差異。總體來看,ChatGPT-4o在準確性上優於ChatGPT-4,顯示AI在牙科教育中的潛在價值,但也需注意其局限性與風險。 PubMed DOI

這項研究評估了多模態人工智慧模型ChatGPT-4o在根管治療中的診斷準確性,並與牙科學生進行比較。研究對象為三年級和五年級的學生,他們根據放射線影像、臨床照片和病歷回答15道選擇題。結果顯示,ChatGPT-4o的正確率達91.4%,明顯超過三年級的60.8%和五年級的79.5%。統計分析顯示各組之間的準確性有顯著差異,ChatGPT-4o的表現更為優越。研究結果顯示,ChatGPT-4o在牙科教育中,特別是根管治療方面,具有很大的潛力。 PubMed DOI

這項研究發現,ChatGPT-4o在判讀下顎智齒拔除用的全口X光片時,正確率只有38.44%,表現不夠理想。雖然回答有一定一致性,但重複性普通,對複雜影像常出錯。現階段還不適合單獨用於牙科臨床,仍需專家把關,未來還要加強AI訓練和開發。 PubMed DOI

最新的語言模型(像 GPT-4o、ChatGPT-4)在牙周病學筆試的表現,已經超越大四牙醫學生,分數甚至接近頂尖學生。其他免費模型(如 Claude、DeepSeek、Gemini)也都比學生高分,其中以 Claude 最突出。不過,這些 AI 的答案有時會不正確或不完整,表現也會隨時間變動。雖然它們能幫助牙醫學習,但在醫療領域還是要謹慎使用。 PubMed DOI

這項研究發現,經過假牙修復專業資料微調的ChatGPT-4,在美國假牙修復專科住院醫師模擬考試的表現,明顯優於原始版本(正確率73.6%比62.7%)。微調能大幅提升AI在專業醫學領域的準確度,但部分主題還需加強訓練。 PubMed DOI

這項研究發現,牙醫學生如果用ChatGPT搭配影片學習,無論在操作技能、自信心還是學習動機上,都比只看影片的學生表現更好,學習壓力也比較小。特別是空間能力較弱的學生,進步最多。整體來說,ChatGPT有助於提升牙醫技能教學的效果,讓教學方式更現代化。 PubMed DOI

這項研究發現,ChatGPT-4o在日本牙體技術師考試的基礎知識題表現不錯,但遇到專業、需要看圖或操作的題目就比較不行。它在牙科材料題的正確率最高,但在矯正和兒童牙科技術題表現較差。整體來說,ChatGPT-4o適合當牙科學習輔助工具,但影像辨識和操作模擬能力還要再加強。 PubMed DOI

這項研究發現,ChatGPT-4.0在ITI植牙認證考試的表現已經跟合格牙醫師差不多,明顯比ChatGPT-3.5好。雖然AI有潛力成為牙科專業的輔助工具,但還需要進一步研究,尤其是針對能看懂影像和影片的AI模型。 PubMed DOI