原始文章

研究發現,ChatGPT在診斷50個口腔病灶案例時,準確度和專業醫師差不多,表現比Microsoft Copilot好。兩種AI都有潛力協助牙醫臨床診斷,尤其是ChatGPT表現最突出。 PubMed DOI


站上相關主題文章列表

這項研究評估了ChatGPT(3.5和4版本)在牙科診斷中的有效性,特別是針對複雜病患案例的表現。結果顯示,ChatGPT 3.5在自身診斷的準確率為40%,而參考文獻時為70%。相比之下,ChatGPT 4的表現更佳,自身診斷準確率達62%,參考文獻時則為80%。這些結果顯示,ChatGPT在牙科診所作為診斷輔助工具具有顯著潛力,能有效處理複雜案例。 PubMed DOI

這項研究比較了ChatGPT-3.5和ChatGPT-4在口腔及顏面疾病鑑別診斷的表現,並與牙科專業人士的結果進行對照。研究中呈現了37個病變案例,結果顯示ChatGPT-4的準確率為80.18%,高於ChatGPT-3.5的64.86%,但仍低於專家的86.64%。兩者在診斷一致性方面表現中等,且受案例描述質量影響。總體而言,ChatGPT-4在某些情況下能達到專家水準,但作為臨床工具的有效性仍需依賴精確的案例資料。 PubMed DOI

大型語言模型(LLMs)在基礎牙科護理中展現潛力,特別是在診斷口腔疾病方面。評估顯示,這些模型在診斷顳顎關節障礙、牙周病、齲齒和錯牙合等病症上都有不錯的表現。特別是ChatGPT 3.5在中文中對牙髓炎的診斷能力從0%提升至61.7%,但對冠周炎的診斷能力下降。相比之下,ChatGPT 4.0在牙髓炎和冠周炎的診斷上都有顯著提升。總體來看,雖然LLMs在牙科護理中有潛力,但仍需進一步改進。 PubMed DOI

這項研究評估了多種人工智慧模型在診斷口腔潛在惡性病變(OPMLs)的準確性,特別是ChatGPT 3.5、4.0、4o和Gemini。研究使用42個案例和兩個數據集的影像進行測試。結果顯示,GPT 4o在文本診斷中表現最佳,正確回答27個案例,其次是GPT 4.0、3.5和Gemini。在影像識別方面,GPT 4o也優於Gemini。不過,這些模型的準確性仍未達到專家水平,顯示出中等到良好的協議程度。研究指出,雖然人工智慧在診斷OPMLs上有潛力,但整合進臨床實踐時需謹慎。 PubMed DOI

這項研究探討了先進的人工智慧演算法及大型語言模型(LLMs),特別是OpenAI的ChatGPT,對牙科診斷的影響。透過公開數據集,這些模型提升了醫療專業人員的診斷能力,改善了患者與醫療提供者的溝通,並提高了臨床效率。ChatGPT-4的推出預期將對口腔外科產生重大影響。本文回顧了LLMs在牙科診斷的應用,並提出未來研究方向,評估人工智慧在醫療領域的潛力與挑戰。 PubMed DOI

這項研究探討了基於人工智慧的聊天機器人ChatGPT-4在口腔黏膜病變鑑別診斷中的有效性。研究收集了因口腔黏膜活檢而轉診的患者數據,並將病變描述輸入ChatGPT以生成診斷,與專家診斷進行比較。結果顯示,聊天機器人的診斷與專家之間有顯著相關性,且能高敏感性識別惡性病變。整體而言,ChatGPT-4在識別可疑惡性病變方面表現出色,顯示出其在口腔醫學中的輔助潛力。 PubMed DOI

這項研究探討大型語言模型(LLMs)在診斷燒灼口症候群(BMS)的準確性。研究使用了三個模型:ChatGPT-4o、Gemini Advanced 1.5 Pro和Claude 3.5 Sonnet,評估100個合成案例。結果顯示,ChatGPT和Claude的準確率達99%,而Gemini為89%。雖然準確率高,但模型在推理上有變異,偶爾會出錯,顯示臨床醫師監督的重要性。研究指出,LLMs可作為BMS的輔助診斷工具,但需專家驗證以確保有效性,對牙醫和專家皆有幫助。 PubMed DOI

這項研究比較八種大型語言模型在土耳其牙科專科考試口腔病理學題目的表現,發現 ChatGPT o1 正確率最高(96%),Copilot 最低。不論題型,ChatGPT o1 都明顯優於其他模型。雖然 LLMs 在牙科教學有潛力,但還需要更多驗證。 PubMed DOI

這項研究比較ChatGPT-4o和Deepseek-v3在16個虛構口腔病理案例的診斷表現。結果顯示,Deepseek-v3的診斷準確度和文獻引用都比ChatGPT-4o好,平均分數也較高(4.02比3.15)。雖然兩者都能協助臨床醫師,但在文獻正確性上還有待加強。目前Deepseek-v3在口腔病理診斷方面表現較優。 PubMed DOI

研究發現,口腔醫學專家在診斷帶圖片的臨床案例時,表現比 ChatGPT-4o 和 DeepSeek-3 這兩款 AI 更好。雖然 DeepSeek-3 在純文字診斷上比 ChatGPT-4o 準確,尤其在複雜或發炎案例,但整體來說,專家還是最可靠。加入影像資訊能提升診斷準確度,但 AI 目前還無法完全取代專業醫師。 PubMed DOI