Dedicated AI Expert System vs Generative AI With Large Language Model for Clinical Diagnoses.
專用 AI 專家系統與大型語言模型生成式 AI 在臨床診斷上的比較
JAMA Netw Open 2025-05-29
From open-ended to multiple-choice: evaluating diagnostic performance and consistency of ChatGPT, Google Gemini and Claude AI.
從開放式問題到選擇題:評估 ChatGPT、Google Gemini 和 Claude AI 的診斷表現與一致性。
Wiad Lek 2024-12-11
這項研究評估了四種大型語言模型(LLMs)在根據臨床案例診斷疾病的表現,包括ChatGPT 3.5、ChatGPT 4o、Google Gemini和Claude AI 3.5 Sonnet。研究分為兩個階段,第一階段僅使用案例描述,第二階段則加入答案選項。結果顯示,Claude AI 3.5 Sonnet和ChatGPT模型在診斷上表現良好,但Google Gemini的效能較低,需謹慎使用於臨床環境。所有模型在一致性方面表現優異。
PubMedDOI
Evaluation of the Performance of Three Large Language Models in Clinical Decision Support: A Comparative Study Based on Actual Cases.
三種大型語言模型在臨床決策支持中的表現評估:基於實際案例的比較研究。
J Med Syst 2025-02-13
Preliminary analysis of the impact of lab results on large language model generated differential diagnoses.
實驗室結果對大型語言模型生成的鑑別診斷影響的初步分析。
NPJ Digit Med 2025-03-19
Large language model evaluation in autoimmune disease clinical questions comparing ChatGPT 4o, Claude 3.5 Sonnet and Gemini 1.5 pro.
自體免疫疾病臨床問題中大型語言模型的評估:比較 ChatGPT 4o、Claude 3.5 Sonnet 與 Gemini 1.5 pro
Sci Rep 2025-05-21
Comparative analysis of large language models in clinical diagnosis: performance evaluation across common and complex medical cases.
大型語言模型於臨床診斷的比較分析:於常見與複雜醫療案例中的表現評估
JAMIA Open 2025-06-13