Performance of ChatGPT on dermatology Specialty Certificate Examination multiple choice questions.
ChatGPT 在皮膚科專業證書考試多重選擇題上的表現。 Clin Exp Dermatol 2023-06-02

ChatGPT是OpenAI研發的語言模型，用來處理語言相關任務。我們在皮膚科的多重選擇題測試中發現，ChatGPT-4的表現優異，得分高達90.5%，超越了一般70-72%的通過標準。這顯示人工智慧在臨床問題回答上有潛力，但在處理複雜病例時仍需謹慎以確保患者安全。 PubMed DOI

An original study of ChatGPT-3.5 and ChatGPT-4 Dermatological Knowledge Level based on the Dermatology Specialty Certificate Examinations.
基於皮膚科專科證書考試，對 ChatGPT-3.5 和 ChatGPT-4 的皮膚學知識水平進行的原創研究。 Clin Exp Dermatol 2023-08-04

研究比較了ChatGPT-3.5和ChatGPT-4在皮膚科知識和臨床決策上的表現，結果顯示ChatGPT-4表現更好，準確率超過80%，尤其在回答臨床圖片問題時表現優異。研究建議雖然人工智慧有助於皮膚科知識，但不應取代醫生決策，應支持AI發展以提升醫療水準。 PubMed DOI

Chat GPT vs Clinician: challenging the diagnostic capabilities of A.I. in dermatology.
Chat GPT 對抗臨床醫師：挑戰人工智慧在皮膚科診斷能力。 Clin Exp Dermatol 2023-11-18

Chat GPT 在皮膚科醫療案例中測試，對專業醫師資訊能正確辨識疾病的比例為56％，對非專業人士資訊為38％。雖然能提供鑑別診斷，但在初級或次級護理環境中並未明顯提高診斷準確性。結果顯示Chat GPT的診斷率與非專業人士相近，但低於專業醫師。 PubMed DOI

Comparison of large language models in management advice for melanoma: Google's AI BARD, BingAI and ChatGPT.
大型語言模型在黑色素瘤管理建議中的比較：Google 的 AI BARD、BingAI 和 ChatGPT。 Skin Health Dis 2024-02-06

大型語言模型如BARD、BingAI和ChatGPT-4正被運用在醫療領域，提供醫學資訊和指導。研究顯示，ChatGPT在黑色素瘤臨床指南方面表現較佳，但所有模型仍有限制。未來研究應該著重整合專業數據和專家知識，以提升模型性能，更好地支援患者護理。 PubMed DOI

Pediatric dermatologists versus AI bots: Evaluating the medical knowledge and diagnostic capabilities of ChatGPT.
小兒皮膚科醫師對抗 AI 機器人：評估 ChatGPT 的醫學知識和診斷能力。 Pediatr Dermatol 2024-05-09

研究比較了OpenAI的ChatGPT在小兒皮膚科的表現，結果顯示醫師通常比ChatGPT更準確，但ChatGPT-4.0在某些情況下表現不錯。研究建議這類人工智慧工具可輔助醫師，但強調改進和醫師監督的重要性。 PubMed DOI

Diagnostic performances of GPT-4o, Claude 3 Opus, and Gemini 1.5 Pro in "Diagnosis Please" cases.
在「診斷請求」案例中，GPT-40、Claude 3 Opus和Gemini 1.5 Pro的診斷表現。 Jpn J Radiol 2024-07-02

大型語言模型（LLMs）如GPT-4o、Claude 3 Opus和Gemini 1.5 Pro在解讀病患病史和影像檢查結果上有潛力。研究比較它們在Radiology Diagnosis Please Cases數據的表現，發現Claude 3 Opus在解決放射學測驗案例時表現最佳。這些LLMs可能有助於放射科醫師更準確地評估和描述影像檢查結果。 PubMed DOI

ChatGPT and dermatology.
ChatGPT 與皮膚科。 Ital J Dermatol Venerol 2024-07-23

人工智慧（AI）在醫學，特別是皮膚科的應用，正逐漸改變醫療保健。根據一項對20項研究的回顧，ChatGPT在提升臨床實踐和病人支持方面展現了潛力。AI與皮膚科的結合，讓醫療服務有了重大進展，因為ChatGPT的對話能力和知識分享功能，讓病人和醫療提供者都能受益。隨著AI技術的持續進步，ChatGPT被視為推動醫療創新的重要角色。 PubMed DOI

Assessing the use of the novel tool Claude 3 in comparison to ChatGPT 4.0 as an artificial intelligence tool in the diagnosis and therapy of primary head and neck cancer cases.
評估新工具 Claude 3 與 ChatGPT 4.0 在診斷和治療原發性頭頸癌病例中的人工智慧工具使用情況。 Eur Arch Otorhinolaryngol 2024-08-07

這項研究評估了新推出的AI模型Claude 3 Opus在診斷和規劃頭頸部鱗狀細胞癌（HNSCC）治療的效果，並與ChatGPT 4.0進行比較。研究於2024年3月進行，涵蓋50例HNSCC病例，並將AI模型的建議與傳統的多學科腫瘤委員會（MDT）建議進行對比。結果顯示，Claude 3 Opus在診斷準確性上優於ChatGPT 4.0，且提供的治療建議與MDT一致。雖然在臨床建議和解釋方面表現相當，但Claude 3未引用資訊來源。總體而言，Claude 3 Opus顯示出作為診斷工具的潛力，建議在臨床環境中使用。 PubMed DOI

Evaluating text and visual diagnostic capabilities of large language models on questions related to the Breast Imaging Reporting and Data System Atlas 5<sup>th</sup> edition.
評估大型語言模型在與乳腺影像報告與數據系統 Atlas 第五版相關問題的文本和視覺診斷能力。 Diagn Interv Radiol 2024-09-09

這項研究評估大型語言模型（LLMs）在解釋乳腺影像報告及提供臨床建議的表現，分為兩個步驟： 1. **文本評估**：比較十個LLMs與放射科醫師在100道BI-RADS選擇題上的準確率。Claude 3.5 Sonnet表現最佳（90%），超過一般放射科醫師（78%）和乳腺放射科醫師（82%）。 2. **視覺評估**：測試五個多模態LLMs在100張乳腺超音波影像上的表現，Claude 3.5 Sonnet以59%準確率領先。研究顯示，雖然LLMs在文本評估中表現良好，但視覺診斷能力有限，需在放射科醫師監督下使用，以避免誤診。 PubMed DOI

Diagnostic Performance of GPT-4o and Claude 3 Opus in Determining Causes of Death From Medical Histories and Postmortem CT Findings.
GPT-4o 和 Claude 3 Opus 在根據醫療歷史和屍體 CT 發現確定死亡原因的診斷表現。 Cureus 2024-09-20

這項研究評估了兩個大型語言模型（LLMs），GPT-4o 和 Claude 3 Opus，在根據病歷和屍體CT掃描識別死亡原因的能力。研究涵蓋100個經解剖確認的成人案例。結果顯示，GPT-4o在根本死亡原因的準確率為78%、72%和78%，而Claude 3 Opus則為72%、56%和75%。在即時死亡原因方面，GPT-4o的準確率較低，分別為55%、58%和62%，而Claude 3 Opus稍高，為60%、62%和63%。整體而言，兩者在診斷死亡原因上表現不俗。 PubMed DOI

原始文章

站上相關主題文章列表