ChatGPT and oral cancer: a study on informational reliability.
ChatGPT 與口腔癌：資訊可靠性的研究。 BMC Oral Health 2025-01-20

這項研究評估了ChatGPT-3.5在回答口腔癌相關問題的準確性，因為早期診斷對患者結果影響重大。研究中提出20個問題，並由醫療專家評估其回答。結果顯示，51.25%的答案被評為非常好，46.25%為好，僅2.5%可接受。專家評分間無顯著差異。雖然ChatGPT提供的資訊可靠，但引用的81篇文獻中，只有13篇是合法的科學文章，10篇為假文獻，其餘則來自各種網站。總體而言，ChatGPT的資訊值得參考，但需謹慎對待其引用來源。 PubMed DOI

Evaluation of Information Provided by ChatGPT Versions on Traumatic Dental Injuries for Dental Students and Professionals.
ChatGPT 版本在創傷性牙齒損傷方面提供的資訊評估：針對牙科學生和專業人士。 Dent Traumatol 2025-01-24

這項研究評估了ChatGPT 3.5和4.0在提供創傷性牙齒損傷資訊上的表現，針對40個問題進行分析。主要發現包括：ChatGPT 3.5的原創回應較多，且可讀性稍好（FRES得分39.732），而4.0在定義和診斷的質量上表現較佳。雖然兩者在可讀性和可靠性上有挑戰，但仍提供高質量資訊，建議作為牙科教育的輔助資源。 PubMed DOI

ChatGPT-4 Omni's superiority in answering multiple-choice oral radiology questions.
ChatGPT-4 Omni 在回答多選口腔放射學問題上的優越性。 BMC Oral Health 2025-02-01

這項研究評估了四個人工智慧模型在土耳其牙科專業入學考試中的表現，包括ChatGPT-3.5、ChatGPT-4 Omni、Google Bard和Microsoft Copilot，針對口腔放射學的多選題進行分析。研究涵蓋了2012至2021年的123道題目。結果顯示，ChatGPT-4 Omni的準確率最高，達86.1%，其次是Google Bard的61.8%。而ChatGPT-3.5和Microsoft Copilot的準確率則較低，分別為43.9%和41.5%。這顯示ChatGPT-4 Omni在推理能力上更為優越，對醫療專業人員和公眾來說是個重要的教育資源。 PubMed DOI

Chat Generative Pre-Trained Transformer (ChatGPT) in Oral and Maxillofacial Surgery: A Narrative Review on Its Research Applications and Limitations.
口腔與顎面外科中的 Chat Generative Pre-Trained Transformer (ChatGPT)：其研究應用與限制的敘述性回顧。 J Clin Med 2025-02-26

本文評估了ChatGPT在口腔與顏面外科（OMS）原創研究中的角色，探討其應用、限制及未來方向。透過PubMed搜尋，最終納入26篇相關研究。結果顯示，ChatGPT在臨床決策支持、患者教育及科學寫作等方面有應用，準確性約70-90%。然而，其可靠性因應用情境而異，需進一步評估。結論指出，ChatGPT可作為輔助工具，但不應取代臨床醫師，未來需加強驗證研究與技術改進。 PubMed DOI

Evaluation of the performance of ChatGPT-4 and ChatGPT-4o as a learning tool in endodontics.
ChatGPT-4 和 ChatGPT-4o 在牙髓學作為學習工具的表現評估。 Int Endod J 2025-03-03

這項研究評估了兩個版本的ChatGPT—ChatGPT-4和ChatGPT-4o—在本科牙髓學教育的多選題回答準確性。共提出60個問題，結果顯示ChatGPT-4o的準確率為92.8%，明顯高於ChatGPT-4的81.7%，且p值小於0.001。雖然問題組影響準確率，但一天中的時間對兩者無影響。兩個模型的一致性無顯著差異。總體來看，ChatGPT-4o在準確性上優於ChatGPT-4，顯示AI在牙科教育中的潛在價值，但也需注意其局限性與風險。 PubMed DOI

The impact of the large language model ChatGPT in oral and maxillofacial surgery: a systematic review.
大型語言模型 ChatGPT 在口腔顎面外科的影響：系統性回顧 Br J Oral Maxillofac Surg 2025-04-18

這篇系統性回顧發現，ChatGPT在口腔顎面外科的臨床決策、手術規劃和病患衛教等方面有輔助效果，尤其在產生手術同意書和術後支持表現不錯，但在藥理學和複雜病例處理上仍有限。建議將ChatGPT作為輔助工具，需專業人員監督，不能完全取代醫師判斷。 PubMed DOI

How valuable are the questions and answers generated by large language models in oral and maxillofacial surgery?
大型語言模型在口腔顎面外科領域所產生的問答內容有多大的價值？ PLoS One 2025-05-28

這項研究發現，ChatGPT-4、ChatGPT-4o 和 Claude 3-Opus 在口腔顎面外科題目的答對率都超過九成，但沒辦法完全正確回答自己出的所有題目。帶圖片的題目表現比純文字好，顯示多模態輸入有助提升準確度。不過，AI 偶爾還是會出錯或產生幻覺，使用時要多加留意。 PubMed DOI

Performance of GPT-4 in oral and maxillofacial surgery board exams: challenges in specialized questions.
GPT-4 在口腔顎面外科專科醫師考試中的表現：專業題目面臨的挑戰 Oral Maxillofac Surg 2025-05-30

這項研究發現，GPT-4在口腔顎面外科專科考題的整體正確率為62%，對藥理學和解剖學表現較好，但在牙科植體和正顎手術等專業題目較弱。顯示GPT-4對一般醫學教育有幫助，但在專業領域還有待加強，未來應持續改進才能應用於進階醫療。 PubMed DOI

Comparative evaluation of responses from DeepSeek-R1, ChatGPT-o1, ChatGPT-4, and dental GPT chatbots to patient inquiries about dental and maxillofacial prostheses.
DeepSeek-R1、ChatGPT-o1、ChatGPT-4 及牙科 GPT 聊天機器人對於患者有關牙科與顎面修復體詢問之回應的比較評估 BMC Oral Health 2025-05-31

這項研究比較四款AI聊天機器人回答牙科相關問題的表現，發現Dental GPT最準確，DeepSeek-R1最容易閱讀，但整體在品質和易懂度上差異不大。研究提醒，AI在醫療領域應謹慎使用，避免錯誤資訊影響病人。 PubMed DOI

Comparative Analysis of ChatGPT-3.5 and GPT-4 in Open-Ended Clinical Reasoning Across Dental Specialties.
ChatGPT-3.5 與 GPT-4 在牙科各專科開放式臨床推理中的比較分析 Eur J Dent Educ 2025-06-14

這項研究發現，GPT-4 在擬定七大牙科專科的治療計畫上，表現比 GPT-3.5 更好，尤其在複雜病例和口腔顎面外科領域更準確一致。顯示 GPT-4 有潛力協助牙科教育和臨床決策，但還是需要專家把關。 PubMed DOI

原始文章

站上相關主題文章列表