Evaluation of the Accuracy of Artificial Intelligence (AI) Models in Dermatological Diagnosis and Comparison With Dermatology Specialists.
人工智慧 (AI) 模型在皮膚病診斷中的準確性評估及與皮膚科專家的比較。 Cureus 2025-02-07

最近生成式人工智慧（AI）在皮膚科診斷的應用上有了新進展，但臨床準確性仍需進一步評估。一項研究比較了三個AI模型與專業皮膚科醫生的診斷表現，結果顯示這些AI模型的準確性與專家相當，甚至在某些罕見和複雜案例中表現更佳。不過，研究樣本量小且可能存在選擇偏差，未來需要更大且多樣化的數據集來驗證AI的臨床實用性。 PubMed DOI

Beyond the Surface: Assessing GPT-4's Accuracy in Detecting Melanoma and Suspicious Skin Lesions From Dermoscopic Images.
超越表面：評估 GPT-4 在從皮膚鏡影像中檢測黑色素瘤和可疑皮膚病變的準確性。 Plast Surg (Oakv) 2025-02-21

本研究探討ChatGPT-4在皮膚病變識別的有效性，特別是黑色素瘤的檢測。結果顯示，GPT-4在黑色素瘤的準確率為68.5%，敏感性52.5%，特異性72.5%，與臨床診斷有顯著差異。對於可疑病變的檢測表現較佳，但仍未能與臨床診斷完全匹配。研究指出，需改進算法並擴大數據集，以提升準確性和普遍性。限制因素包括樣本量小及數據來源的特定性。 PubMed DOI

Evaluating the Diagnostic Accuracy of ChatGPT-4 Omni and ChatGPT-4 Turbo in Identifying Melanoma: Comparative Study.
評估 ChatGPT-4 Omni 和 ChatGPT-4 Turbo 在識別黑色素瘤中的診斷準確性：比較研究。 JMIR Dermatol 2025-03-21

您的研究強調了將像 ChatGPT 這樣的 AI 工具整合進醫療保健的重要性，特別是在皮膚科領域。雖然 AI 有助於診斷黑色素瘤等疾病，但目前 ChatGPT 在準確性上仍有不足，顯示出持續研究和開發的必要性。未來的改進應著重於提升模型對醫療影像和臨床數據的理解，以更好地支持醫療專業人員的決策需求。 PubMed DOI

Evaluating Sex and Age Biases in Multimodal Large Language Models for Skin Disease Identification from Dermatoscopic Images.
評估多模態大型語言模型在從皮膚鏡影像識別皮膚疾病時的性別和年齡偏見。 Health Data Sci 2025-04-02

這項研究評估了多模態大型語言模型（LLMs）在識別皮膚疾病的應用，並檢視性別和年齡的偏見。研究中使用了ChatGPT-4和LLaVA-1.6，結果顯示它們的準確率和F1分數超過了多個深度學習模型，但仍低於最佳的視覺變壓器模型。值得注意的是，ChatGPT-4和LLaVA-1.6在性別和年齡方面沒有偏見，顯示出在皮膚科應用中的潛力。未來需進一步研究以確保這些模型在醫療中的可靠性與公平性。 PubMed DOI

Synthetic medical education in dermatology leveraging generative artificial intelligence.
運用生成式人工智慧於皮膚科的合成醫學教育 NPJ Digit Med 2025-05-04

GPT-4 這類大型語言模型能產出高品質、完整又準確的臨床案例，對醫學教育很有幫助，專家也給予高度肯定，認為風險和偏見都很低。不過，目前在族群多元性上還有待加強。未來若能補足這點，LLM 有機會讓醫學教育更大規模、也更客製化。 PubMed DOI

Evaluating the Diagnostic and Treatment Capabilities of GPT-4 Vision in Dermatology: A Pilot Study.
GPT-4 Vision 在皮膚科診斷與治療能力之評估：初步研究 J Cutan Med Surg 2025-05-06

這項研究發現，GPT-4V在診斷皮膚病時，單用文字的準確率很高（89%），只看圖片就明顯下降（54%），圖片加文字也沒更好。治療建議方面，GPT-4V表現不錯但還沒達到專家水準，圖片加文字時最好。整體來說，GPT-4V適合當輔助工具，尤其擅長處理文字，但圖片判讀和多模態整合還需加強。 PubMed DOI

The Performance of AI in Dermatology Exams: The Exam Success and Limits of ChatGPT.
AI 在皮膚科考試中的表現：ChatGPT 的考試通過率與侷限性 J Cosmet Dermatol 2025-05-19

這項研究發現，ChatGPT 3.5在皮膚科住院醫師考題表現不如資深醫師，只能應付簡單題目；4.0版雖然進步，能達到部分初中階醫師水準，但遇到難題還是有瓶頸。整體來說，ChatGPT 4.0在皮膚科教育有潛力，但目前還無法取代資深醫師，未來若持續進步，對醫學訓練會更有幫助。 PubMed DOI

Large language models for dermatological image interpretation - a comparative study.
皮膚科影像判讀之大型語言模型比較研究 Diagnosis (Berl) 2025-05-27

這項研究比較七款主流多模態大型語言模型在診斷皮膚病的表現，GPT-4o準確率最高達67.8%。不同疾病和圖片的診斷準確度差異大，有些圖片所有模型都誤判。部分模型遇到敏感圖片會拒絕診斷。整體來說，這些模型在皮膚科影像判讀有潛力，但目前還有不少限制，未來需結合臨床資料才能更可靠。 PubMed DOI

The Role of ChatGPT in Dermatology Diagnostics.
ChatGPT 在皮膚科診斷中的角色 Diagnostics (Basel) 2025-06-26

ChatGPT 這類 AI 語言模型，已經用在皮膚科，幫忙解讀資料、協助診斷和提升醫病溝通。結合 CNN 等影像分析工具後，能整合文字和圖片資訊，讓診斷更精準。不過，ChatGPT 不能直接看圖，有時也會出錯，像病人隱私和醫師責任這些倫理問題還是要注意。未來有望發展更整合的 AI 系統，讓皮膚科照護更進步。 PubMed DOI

Performance Evaluation of ChatGPT-4o in Dermatological Diagnoses Across Fitzpatrick Skin Types.
ChatGPT-4o 在不同 Fitzpatrick 皮膚型態下皮膚病診斷的表現評估 Cureus 2025-08-06

研究發現，ChatGPT-4o在診斷深色皮膚的黑色素瘤時，準確率明顯低於淺色皮膚，無論敏感度、特異性或整體表現都較差。這顯示AI在膚色多元性不足時容易產生偏誤，未來皮膚科資料庫應納入更多不同膚色的影像。 PubMed DOI

原始文章

站上相關主題文章列表