The use of a ChatGPT-4-based chatbot in teledermatology: A retrospective exploratory study.
基於 ChatGPT-4 的聊天機器人在遠程皮膚科中的應用：一項回顧性探索性研究。 J Dtsch Dermatol Ges 2025-01-13

這項研究探討了ChatGPT-4在遠程皮膚科的應用，將其在圖像描述和診斷生成的表現與人類醫生進行比較。分析了154個遠程諮詢，結果顯示ChatGPT-4的第一診斷一致性為70.8%，前三名一致性達87.7%。此外，該聊天機器人的圖像描述準確率高達84.4%，超過人類醫生。這些結果顯示，ChatGPT-4在提升遠程皮膚科診斷和圖像分析方面具有潛力，暗示人工智慧在醫療領域的未來角色。 PubMed DOI

Accuracy of ChatGPT 3.5, 4.0, 4o and Gemini in diagnosing oral potentially malignant lesions based on clinical case reports and image recognition.
基於臨床案例報告和影像識別，ChatGPT 3.5、4.0、4o 和 Gemini 在診斷口腔潛在惡性病變的準確性。 Med Oral Patol Oral Cir Bucal 2025-01-26

這項研究評估了多種人工智慧模型在診斷口腔潛在惡性病變（OPMLs）的準確性，特別是ChatGPT 3.5、4.0、4o和Gemini。研究使用42個案例和兩個數據集的影像進行測試。結果顯示，GPT 4o在文本診斷中表現最佳，正確回答27個案例，其次是GPT 4.0、3.5和Gemini。在影像識別方面，GPT 4o也優於Gemini。不過，這些模型的準確性仍未達到專家水平，顯示出中等到良好的協議程度。研究指出，雖然人工智慧在診斷OPMLs上有潛力，但整合進臨床實踐時需謹慎。 PubMed DOI

Beyond the Surface: Assessing GPT-4's Accuracy in Detecting Melanoma and Suspicious Skin Lesions From Dermoscopic Images.
超越表面：評估 GPT-4 在從皮膚鏡影像中檢測黑色素瘤和可疑皮膚病變的準確性。 Plast Surg (Oakv) 2025-02-21

本研究探討ChatGPT-4在皮膚病變識別的有效性，特別是黑色素瘤的檢測。結果顯示，GPT-4在黑色素瘤的準確率為68.5%，敏感性52.5%，特異性72.5%，與臨床診斷有顯著差異。對於可疑病變的檢測表現較佳，但仍未能與臨床診斷完全匹配。研究指出，需改進算法並擴大數據集，以提升準確性和普遍性。限制因素包括樣本量小及數據來源的特定性。 PubMed DOI

Language Artificial Intelligence Models as Pioneers in Diagnostic Medicine? A Retrospective Analysis on Real-Time Patients.
語言人工智慧模型作為診斷醫學的先驅？對即時患者的回顧性分析。 J Clin Med 2025-02-26

本研究探討AI模型（如GPT-3.5和GPT-4）在急診科生成病症鑑別診斷的表現，並與急診科醫師的準確性進行比較。結果顯示，ChatGPT-4的準確率為85.5%，略高於ChatGPT-3.5的84.6%和醫師的83%。特別是在腸胃主訴方面，ChatGPT-4的準確性達87.5%。研究顯示AI模型在臨床決策中具潛在應用價值，建議未來進一步探索AI在醫療中的應用。 PubMed DOI

Evaluating the Diagnostic Accuracy of ChatGPT-4 Omni and ChatGPT-4 Turbo in Identifying Melanoma: Comparative Study.
評估 ChatGPT-4 Omni 和 ChatGPT-4 Turbo 在識別黑色素瘤中的診斷準確性：比較研究。 JMIR Dermatol 2025-03-21

您的研究強調了將像 ChatGPT 這樣的 AI 工具整合進醫療保健的重要性，特別是在皮膚科領域。雖然 AI 有助於診斷黑色素瘤等疾病，但目前 ChatGPT 在準確性上仍有不足，顯示出持續研究和開發的必要性。未來的改進應著重於提升模型對醫療影像和臨床數據的理解，以更好地支持醫療專業人員的決策需求。 PubMed DOI

A Comparative Analysis of the Performance of Large Language Models and Human Respondents in Dermatology.
大型語言模型與人類受訪者在皮膚科表現的比較分析。 Indian Dermatol Online J 2025-03-24

這項研究探討大型語言模型（LLMs），如ChatGPT和Microsoft Bing Chat，在皮膚科、性病學和麻風問題上的回答效果。研究比較了這些AI模型與12位研究所學生的準確性，並評估了人工幻覺的情況。研究於2023年8月進行，包含60個問題。結果顯示，Bing Chat的表現最佳，平均正確率為78.2%，ChatGPT為59.8%，人類受訪者則為43%。Bing Chat在簡單和中等難度問題上表現更佳，而ChatGPT在較難問題上較強。研究指出，儘管LLMs表現優於人類，但在某些領域準確性仍不足，需制定規範以防止濫用。 PubMed DOI

Dermacen analytica: A novel methodology integrating multi-modal large language models with machine learning in dermatology.
Dermacen analytica：一種將多模態大型語言模型與機器學習整合於皮膚科的新方法。 Int J Med Inform 2025-03-28

這項研究提出了一種新穎的人工智慧方法，幫助皮膚科醫生診斷皮膚疾病，模擬專業診斷過程。它結合了影像分析、語言模型和機器學習工具，採用多種AI技術來提升決策能力。測試數據集顯示，準確率達87%，顯示出良好的推理和診斷能力。這項研究不僅驗證了AI在皮膚科的應用潛力，還提出了未來實施的策略框架，以改善病人經驗。 PubMed DOI

The Performance of AI in Dermatology Exams: The Exam Success and Limits of ChatGPT.
AI 在皮膚科考試中的表現：ChatGPT 的考試通過率與侷限性 J Cosmet Dermatol 2025-05-19

這項研究發現，ChatGPT 3.5在皮膚科住院醫師考題表現不如資深醫師，只能應付簡單題目；4.0版雖然進步，能達到部分初中階醫師水準，但遇到難題還是有瓶頸。整體來說，ChatGPT 4.0在皮膚科教育有潛力，但目前還無法取代資深醫師，未來若持續進步，對醫學訓練會更有幫助。 PubMed DOI

The Role of ChatGPT in Dermatology Diagnostics.
ChatGPT 在皮膚科診斷中的角色 Diagnostics (Basel) 2025-06-26

ChatGPT 這類 AI 語言模型，已經用在皮膚科，幫忙解讀資料、協助診斷和提升醫病溝通。結合 CNN 等影像分析工具後，能整合文字和圖片資訊，讓診斷更精準。不過，ChatGPT 不能直接看圖，有時也會出錯，像病人隱私和醫師責任這些倫理問題還是要注意。未來有望發展更整合的 AI 系統，讓皮膚科照護更進步。 PubMed DOI

AI-generated dermatologic images show deficient skin tone diversity and poor diagnostic accuracy: An experimental study.
AI 生成的皮膚科影像顯示膚色多樣性不足及診斷準確性不佳：一項實驗性研究 J Eur Acad Dermatol Venereol 2025-07-16

這項研究發現，主流AI生成皮膚科影像時，膚色多樣性嚴重不足，尤其深色皮膚比例被低估，只有Adobe Firefly較貼近美國實際分布。診斷準確率也很低，僅15%影像正確顯示疾病。若不改善資料和指引，AI恐加劇皮膚科健康不平等。 PubMed DOI

原始文章

站上相關主題文章列表