Accuracy of ChatGPT 3.5, 4.0, 4o and Gemini in diagnosing oral potentially malignant lesions based on clinical case reports and image recognition.
基於臨床案例報告和影像識別，ChatGPT 3.5、4.0、4o 和 Gemini 在診斷口腔潛在惡性病變的準確性。 Med Oral Patol Oral Cir Bucal 2025-01-26

這項研究評估了多種人工智慧模型在診斷口腔潛在惡性病變（OPMLs）的準確性，特別是ChatGPT 3.5、4.0、4o和Gemini。研究使用42個案例和兩個數據集的影像進行測試。結果顯示，GPT 4o在文本診斷中表現最佳，正確回答27個案例，其次是GPT 4.0、3.5和Gemini。在影像識別方面，GPT 4o也優於Gemini。不過，這些模型的準確性仍未達到專家水平，顯示出中等到良好的協議程度。研究指出，雖然人工智慧在診斷OPMLs上有潛力，但整合進臨床實踐時需謹慎。 PubMed DOI

Transforming dental diagnostics with artificial intelligence: advanced integration of ChatGPT and large language models for patient care.
利用人工智慧轉變牙科診斷：ChatGPT 和大型語言模型在病患照護中的進階整合。 Front Dent Med 2025-02-07

這項研究探討了先進的人工智慧演算法及大型語言模型（LLMs），特別是OpenAI的ChatGPT，對牙科診斷的影響。透過公開數據集，這些模型提升了醫療專業人員的診斷能力，改善了患者與醫療提供者的溝通，並提高了臨床效率。ChatGPT-4的推出預期將對口腔外科產生重大影響。本文回顧了LLMs在牙科診斷的應用，並提出未來研究方向，評估人工智慧在醫療領域的潛力與挑戰。 PubMed DOI

Evaluating ChatGPT o1's Capabilities in Peripheral Nerve Surgery: Advancing AI in Clinical Practice.
評估 ChatGPT o1 在周邊神經外科的能力：推進人工智慧在臨床實踐中的應用。 World Neurosurg 2025-02-09

這項研究探討了OpenAI的生成式AI模型o1作為虛擬醫療助手（GPT-NS）在周邊神經手術決策中的應用。透過模擬五個臨床情境，AI協助外科醫生處理病歷、診斷和治療計畫，並提供案例摘要。神經外科專家和住院醫師評估GPT-NS的表現，平均得分4.3。雖然AI在理解臨床問題和案例呈現上表現優異，但在診斷排序和治療建議上仍需改進。研究強調專家評估AI輸出的重要性，並建議未來應提升AI能力並整合進手術流程。 PubMed DOI

Preliminary evaluation of ChatGPT model iterations in emergency department diagnostics.
急診科診斷中 ChatGPT 模型迭代的初步評估。 Sci Rep 2025-03-27

這項回顧性研究評估了不同ChatGPT模型（如GPT-3.5、GPT-4等）在預測急診病人診斷的表現。研究針對30名病人，發現GPT-3.5在前三名鑑別診斷的準確率高達80%，但主要診斷的準確率僅47.8%。較新的模型如chatgpt-4o-latest在主要診斷的準確率提升至60%。要求模型提供推理過程也有助於改善表現。不過，所有模型在處理非典型案例時仍面臨挑戰，顯示其在急診環境中的應用限制。 PubMed DOI

Decoding wisdom: Evaluating ChatGPT's accuracy and reproducibility in analyzing orthopantomographic images for third molar assessment.
解碼智慧：評估 ChatGPT 在分析全口顱顎斷層影像以評估第三大臼齒時的準確性與再現性 Comput Struct Biotechnol J 2025-04-24

這項研究發現，ChatGPT-4o在判讀下顎智齒拔除用的全口X光片時，正確率只有38.44%，表現不夠理想。雖然回答有一定一致性，但重複性普通，對複雜影像常出錯。現階段還不適合單獨用於牙科臨床，仍需專家把關，未來還要加強AI訓練和開發。 PubMed DOI

Can deepseek and ChatGPT be used in the diagnosis of oral pathologies?
你提供的標題是： **Can deepseek and ChatGPT be used in the diagnosis of oral pathologies?** 翻譯為繁體中文(zh-TW)如下： **deepseek 與 ChatGPT 可用於口腔病理診斷嗎？** BMC Oral Health 2025-04-25

這項研究比較ChatGPT-4o和Deepseek-v3在16個虛構口腔病理案例的診斷表現。結果顯示，Deepseek-v3的診斷準確度和文獻引用都比ChatGPT-4o好，平均分數也較高（4.02比3.15）。雖然兩者都能協助臨床醫師，但在文獻正確性上還有待加強。目前Deepseek-v3在口腔病理診斷方面表現較優。 PubMed DOI

Performance of a virtual assistant based on ChatGPT-4 in the diagnosis of syndromes with orofacial manifestations.
基於 ChatGPT-4 的虛擬助理在診斷具口面部表現症候群之表現 Oral Surg Oral Med Oral Pathol Oral Radiol 2025-05-08

GPT-4虛擬助理SDOF在26個臨床案例中，能準確辨識96.2%的病例，且多半在前兩次猜測就答對。它在相關性、實用性和易讀性表現優異，但在資訊完整性和更新度上還有進步空間。雖然診斷輔助效果不錯，仍需專業醫師監督並持續優化內容。 PubMed DOI

Comparative Analysis of ChatGPT-3.5 and GPT-4 in Open-Ended Clinical Reasoning Across Dental Specialties.
ChatGPT-3.5 與 GPT-4 在牙科各專科開放式臨床推理中的比較分析 Eur J Dent Educ 2025-06-14

這項研究發現，GPT-4 在擬定七大牙科專科的治療計畫上，表現比 GPT-3.5 更好，尤其在複雜病例和口腔顎面外科領域更準確一致。顯示 GPT-4 有潛力協助牙科教育和臨床決策，但還是需要專家把關。 PubMed DOI

Diagnostic Performance of ChatGPT-4o and DeepSeek-3 Differential Diagnosis of Complex Oral Lesions: A Multimodal Imaging and Case Difficulty Analysis.
ChatGPT-4o 與 DeepSeek-3 在複雜口腔病變鑑別診斷的診斷表現：多模態影像與病例難度分析 Oral Dis 2025-07-01

研究發現，口腔醫學專家在診斷帶圖片的臨床案例時，表現比 ChatGPT-4o 和 DeepSeek-3 這兩款 AI 更好。雖然 DeepSeek-3 在純文字診斷上比 ChatGPT-4o 準確，尤其在複雜或發炎案例，但整體來說，專家還是最可靠。加入影像資訊能提升診斷準確度，但 AI 目前還無法完全取代專業醫師。 PubMed DOI

The Diagnostic Performance of Large Language Models and Oral Medicine Consultants for Identifying Oral Lesions in Text-Based Clinical Scenarios: Prospective Comparative Study.
大型語言模型與口腔醫學專科醫師在文字型臨床情境中辨識口腔病變的診斷表現：前瞻性比較研究 JMIR AI 2025-07-03

研究發現，ChatGPT在診斷50個口腔病灶案例時，準確度和專業醫師差不多，表現比Microsoft Copilot好。兩種AI都有潛力協助牙醫臨床診斷，尤其是ChatGPT表現最突出。 PubMed DOI

原始文章

站上相關主題文章列表