Accuracy of ChatGPT 3.5, 4.0, 4o and Gemini in diagnosing oral potentially malignant lesions based on clinical case reports and image recognition.
基於臨床案例報告和影像識別，ChatGPT 3.5、4.0、4o 和 Gemini 在診斷口腔潛在惡性病變的準確性。 Med Oral Patol Oral Cir Bucal 2025-01-26

這項研究評估了多種人工智慧模型在診斷口腔潛在惡性病變（OPMLs）的準確性，特別是ChatGPT 3.5、4.0、4o和Gemini。研究使用42個案例和兩個數據集的影像進行測試。結果顯示，GPT 4o在文本診斷中表現最佳，正確回答27個案例，其次是GPT 4.0、3.5和Gemini。在影像識別方面，GPT 4o也優於Gemini。不過，這些模型的準確性仍未達到專家水平，顯示出中等到良好的協議程度。研究指出，雖然人工智慧在診斷OPMLs上有潛力，但整合進臨床實踐時需謹慎。 PubMed DOI

Evaluating ChatGPT's diagnostic potential for pathology images.
評估 ChatGPT 在病理影像診斷中的潛力。 Front Med (Lausanne) 2025-02-07

這項研究評估了OpenAI開發的GPT-4在病理影像分析中的診斷準確性。研究涵蓋16個器官的44張組織病理影像及100張結直腸活檢顯微照片。GPT-4在腫瘤類型和組織來源的整體準確率為0.64，結腸息肉的分類準確率介於0.57到0.75之間。它在區分低級別和高級別不典型增生方面表現良好，準確率達0.88，對腺癌檢測的敏感性也很高。整體來看，GPT-4的表現與病理住院醫師相當，顯示其作為輔助工具的潛力。 PubMed DOI

Comparing ChatGPT 4.0's Performance in Interpreting Thyroid Nodule Ultrasound Reports Using ACR-TI-RADS 2017: Analysis Across Different Levels of Ultrasound User Experience.
比較 ChatGPT 4.0 在解讀使用 ACR-TI-RADS 2017 的甲狀腺結節超音波報告中的表現：不同超音波使用者經驗水平的分析。 Diagnostics (Basel) 2025-03-13

本研究評估了ChatGPT 4.0根據ACR-TI-RADS 2017標準解讀甲狀腺超音波報告的能力，並與醫療專家及一名缺乏經驗的使用者進行比較。結果顯示，ChatGPT在回聲焦點的評估上與專家一致，但在其他標準上則有不一致。缺乏經驗的使用者表現優於ChatGPT，顯示傳統醫學訓練的重要性。結論指出，ChatGPT可作為輔助診斷工具，但無法取代人類專業知識，並建議改善AI算法以增強其臨床實用性。 PubMed DOI

Assessing the performance of an artificial intelligence based chatbot in the differential diagnosis of oral mucosal lesions: clinical validation study.
評估基於人工智慧的聊天機器人在口腔黏膜病變鑑別診斷中的表現：臨床驗證研究。 Clin Oral Investig 2025-03-18

這項研究探討了基於人工智慧的聊天機器人ChatGPT-4在口腔黏膜病變鑑別診斷中的有效性。研究收集了因口腔黏膜活檢而轉診的患者數據，並將病變描述輸入ChatGPT以生成診斷，與專家診斷進行比較。結果顯示，聊天機器人的診斷與專家之間有顯著相關性，且能高敏感性識別惡性病變。整體而言，ChatGPT-4在識別可疑惡性病變方面表現出色，顯示出其在口腔醫學中的輔助潛力。 PubMed DOI

Evaluating the Diagnostic Accuracy of ChatGPT-4 Omni and ChatGPT-4 Turbo in Identifying Melanoma: Comparative Study.
評估 ChatGPT-4 Omni 和 ChatGPT-4 Turbo 在識別黑色素瘤中的診斷準確性：比較研究。 JMIR Dermatol 2025-03-21

您的研究強調了將像 ChatGPT 這樣的 AI 工具整合進醫療保健的重要性，特別是在皮膚科領域。雖然 AI 有助於診斷黑色素瘤等疾病，但目前 ChatGPT 在準確性上仍有不足，顯示出持續研究和開發的必要性。未來的改進應著重於提升模型對醫療影像和臨床數據的理解，以更好地支持醫療專業人員的決策需求。 PubMed DOI

AI in clinical decision-making: ChatGPT-4 vs. Llama2 for otolaryngology cases.
臨床決策中的人工智慧：ChatGPT-4 與 Llama2 在耳鼻喉科案例中的比較。 Eur Arch Otorhinolaryngol 2025-04-12

一項針對98個耳鼻喉科案例的研究評估了ChatGPT-4和Llama2的診斷準確性及建議的適當性。結果顯示，ChatGPT-4在82%的案例中正確診斷，優於Llama2的76%。在額外檢查建議上，ChatGPT-4的相關性為88%，Llama2則為83%。治療適當性方面，ChatGPT-4達80%，Llama2為72%。雖然兩者表現不錯，但仍有不適當建議的情況，顯示需進一步改進及人類監督以確保安全應用。 PubMed DOI

ChatGPT-4 vs. multi-disciplinary tumor board decisions for the therapeutic management of primary laryngeal cancer.
ChatGPT-4 與多專科腫瘤團隊在原發性喉癌治療管理決策上的比較 Acta Otolaryngol 2025-05-13

這項研究發現，ChatGPT-4在建議原發性喉癌治療時，有72%和多專科腫瘤團隊（MDT）決策完全一致，且沒有明顯錯誤。其準確度和病人特徵無明顯關聯。未來若再優化，ChatGPT-4有機會成為醫師管理喉癌的好幫手。 PubMed DOI

Evaluating advanced AI reasoning models: ChatGPT-4.0 and DeepSeek-R1 diagnostic performance in otolaryngology: a comparative analysis.
進階 AI 推理模型於耳鼻喉科診斷表現之評估：ChatGPT-4.0 與 DeepSeek-R1 的比較分析 Am J Otolaryngol 2025-05-14

這項研究比較ChatGPT-4.0和DeepSeek-R1在回答耳鼻喉科手術常見問題的表現。ChatGPT-4.0內容較詳細但有時會漏掉手術細節，DeepSeek-R1則簡潔但細節不足。兩者在複雜手術和長期照護上都不夠完善，目前都還不適合提供個別病人專業建議，AI在這領域還需加強。 PubMed DOI

Assessing the value of artificial intelligence-based image analysis for pre-operative surgical planning of neck dissections and iENE detection in head and neck cancer patients.
以人工智慧為基礎的影像分析在頭頸癌患者頸部清掃術前手術規劃及iENE偵測之價值評估 Discov Oncol 2025-05-30

這項研究發現，ChatGPT-4V在判斷頭頸癌病患CT影像的淋巴結轉移和外侵犯時，雖然敏感度很高（100%），但特異性較低（約34%），容易高估病情，建議過度手術。雖然現階段還不適合直接用於手術規劃，但AI分析速度快、推理能力強，未來仍有成為輔助工具的潛力。 PubMed DOI

Diagnostic Performance of ChatGPT-4o and DeepSeek-3 Differential Diagnosis of Complex Oral Lesions: A Multimodal Imaging and Case Difficulty Analysis.
ChatGPT-4o 與 DeepSeek-3 在複雜口腔病變鑑別診斷的診斷表現：多模態影像與病例難度分析 Oral Dis 2025-07-01

研究發現，口腔醫學專家在診斷帶圖片的臨床案例時，表現比 ChatGPT-4o 和 DeepSeek-3 這兩款 AI 更好。雖然 DeepSeek-3 在純文字診斷上比 ChatGPT-4o 準確，尤其在複雜或發炎案例，但整體來說，專家還是最可靠。加入影像資訊能提升診斷準確度，但 AI 目前還無法完全取代專業醫師。 PubMed DOI

原始文章

站上相關主題文章列表