原始文章

這項研究探討了基於人工智慧的聊天機器人ChatGPT-4在口腔黏膜病變鑑別診斷中的有效性。研究收集了因口腔黏膜活檢而轉診的患者數據,並將病變描述輸入ChatGPT以生成診斷,與專家診斷進行比較。結果顯示,聊天機器人的診斷與專家之間有顯著相關性,且能高敏感性識別惡性病變。整體而言,ChatGPT-4在識別可疑惡性病變方面表現出色,顯示出其在口腔醫學中的輔助潛力。 PubMed DOI


站上相關主題文章列表

研究發現ChatGPT在臨床案例中的診斷和治療方面表現準確,並得到醫師認可。這顯示人工智慧模型在醫療領域與醫生合作的潛力,可減少錯誤和工作量。然而,仍需進一步研究以了解其能力和潛在偏見。 PubMed DOI

醫療領域的人工智慧越來越進步,專注在認知能力,像是做決策和解決問題。ChatGPT是一個自然語言處理模型,已經被研究在回答口腔病理學相關問題上的表現。研究使用了ChatGPT3.5回答了25個問題,並由病理學家評估。這個研究顯示了在處理病理學問題上的能力,產生了有意義的回答。未來版本需要更多研究以提升準確性。 PubMed DOI

這項研究評估了ChatGPT(3.5和4版本)在牙科診斷中的有效性,特別是針對複雜病患案例的表現。結果顯示,ChatGPT 3.5在自身診斷的準確率為40%,而參考文獻時為70%。相比之下,ChatGPT 4的表現更佳,自身診斷準確率達62%,參考文獻時則為80%。這些結果顯示,ChatGPT在牙科診所作為診斷輔助工具具有顯著潛力,能有效處理複雜案例。 PubMed DOI

這項研究比較了ChatGPT-3.5和ChatGPT-4在口腔及顏面疾病鑑別診斷的表現,並與牙科專業人士的結果進行對照。研究中呈現了37個病變案例,結果顯示ChatGPT-4的準確率為80.18%,高於ChatGPT-3.5的64.86%,但仍低於專家的86.64%。兩者在診斷一致性方面表現中等,且受案例描述質量影響。總體而言,ChatGPT-4在某些情況下能達到專家水準,但作為臨床工具的有效性仍需依賴精確的案例資料。 PubMed DOI

這項研究評估了四款AI聊天機器人(ChatGPT 3.5、ChatGPT 4.0、Bard和Bing)在牙髓及根尖周圍疾病診斷和治療建議的準確性。研究創建了十一個案例,結果顯示Bing和ChatGPT 4.0的診斷準確率最高,分別為86.4%和85.3%。在治療建議方面,ChatGPT 4.0和Bing表現相似,均超過90%。整體一致性率達98.29%,但仍需牙科專業人員謹慎解讀這些AI的回應,因為存在不一致性。 PubMed DOI

這項研究探討人工智慧(AI)在早期診斷口腔扁平苔蘚(OLP)的應用,傳統上依賴臨床經驗。研究分析了128名OLP患者的影像,評估多個AI平台的診斷效果。經過訓練後,AI的診斷準確率顯著提升,頰黏膜病變的識別率高達94%。不過,AI在識別不常見部位和複雜病例上仍有困難,特別是牙齦病變。這項研究顯示AI在口腔醫學的潛力與挑戰,為未來應用提供了重要見解。 PubMed DOI

這項研究評估了ChatGPT在口腔外科、預防牙科和口腔癌領域提供的資訊質量。專家設計了50個問題,結果顯示ChatGPT在預防牙科方面表現最佳,得分4.3(滿分5),能有效傳達複雜資訊。但在口腔外科(3.9)和口腔癌(3.6)方面得分較低,顯示在術後指導和個性化建議上有不足。研究強調在使用AI資訊時需有專業監督,並持續評估AI的能力,以確保病人護理的負責任使用。 PubMed DOI

這項研究評估了ChatGPT-4.0在根據組織病理學描述識別口腔及顏面部病變的表現,並與病理學家的診斷進行比較。分析了102個匿名病例,ChatGPT-4.0的診斷準確率為59.8%,正確診斷61個病例。結果顯示,年齡與診斷分數有中度負相關,性別則無顯著影響。ChatGPT-4.0在肉芽腫和炎症病例的診斷上特別困難,錯誤率高達100%;而在黏液囊腫病例中表現最佳,正確率為93.3%。整體而言,顯示出進一步改進的必要性。 PubMed DOI

這項研究評估了多種人工智慧模型在診斷口腔潛在惡性病變(OPMLs)的準確性,特別是ChatGPT 3.5、4.0、4o和Gemini。研究使用42個案例和兩個數據集的影像進行測試。結果顯示,GPT 4o在文本診斷中表現最佳,正確回答27個案例,其次是GPT 4.0、3.5和Gemini。在影像識別方面,GPT 4o也優於Gemini。不過,這些模型的準確性仍未達到專家水平,顯示出中等到良好的協議程度。研究指出,雖然人工智慧在診斷OPMLs上有潛力,但整合進臨床實踐時需謹慎。 PubMed DOI

這項研究評估了基於人工智慧的聊天機器人,特別是ChatGPT 3.5和Claude-instant,在複雜口腔外科案例中輔助臨床決策的效果。口腔及顏面外科醫生設計了一系列問題,並透過專業評估工具來檢視聊天機器人的回應質量。結果顯示,ChatGPT和Claude-instant都提供高質量的回應,ChatGPT的質量評分分別為86%和79.6%,而Claude-instant則為81.25%和89%。這些結果顯示聊天機器人技術的進步,可能提升醫療效率並降低成本。 PubMed DOI