Artificial intelligence in rheumatology research: what is it good for?
風濕病學研究中的人工智慧：它有何用處？ RMD Open 2025-01-08

人工智慧（AI）正顯著改變風濕病學的研究，提升診斷、預後和治療預測的能力。研究者探索AI如何簡化工作流程、改善藥物發現及優化臨床試驗。機器學習在準確分類風濕性疾病和預測治療結果方面表現出色，並利用多種數據來源。生成式AI也逐漸成為自動化文獻回顧和支持臨床決策的重要工具。本文討論AI在風濕病學的應用及其面臨的倫理和監管挑戰，強調謹慎整合以發揮其潛力。 PubMed DOI

Evaluation of the Accuracy of Artificial Intelligence (AI) Models in Dermatological Diagnosis and Comparison With Dermatology Specialists.
人工智慧 (AI) 模型在皮膚病診斷中的準確性評估及與皮膚科專家的比較。 Cureus 2025-02-07

最近生成式人工智慧（AI）在皮膚科診斷的應用上有了新進展，但臨床準確性仍需進一步評估。一項研究比較了三個AI模型與專業皮膚科醫生的診斷表現，結果顯示這些AI模型的準確性與專家相當，甚至在某些罕見和複雜案例中表現更佳。不過，研究樣本量小且可能存在選擇偏差，未來需要更大且多樣化的數據集來驗證AI的臨床實用性。 PubMed DOI

Evaluating Large Language Model Performance to Support the Diagnosis and Management of Patients with Primary Immune Disorders.
評估大型語言模型在支持原發性免疫疾病患者診斷和管理中的表現。 J Allergy Clin Immunol 2025-02-16

生成式人工智慧（GAI）在醫療領域有顯著進展，但對於罕見疾病如原發性免疫疾病（PI）的輔助效果仍待探討。本研究評估了六種大型語言模型（LLMs）在提供PI臨床指導的表現。結果顯示，GPT-4o、Llama-3.1-70B-Instruct和Mistral-Large-Instruct-2407的診斷準確率超過88%，其中GPT-4o以96.2%領先。其他模型表現較差，準確率約60%或更低。雖然LLMs在PI診斷上顯示潛力，但仍需改進以提升臨床實用性。 PubMed DOI

Evaluating large language models as a supplementary patient information resource on antimalarial use in systemic lupus erythematosus.
評估大型語言模型作為系統性紅斑狼瘡抗瘧藥使用的補充病患資訊資源。 Lupus 2025-02-27

這項研究評估了三種大型語言模型（LLMs）—Copilot、GPT-3.5 和 GPT-4—在提供抗瘧疾藥物對系統性紅斑狼瘡（SLE）使用的準確性和完整性。研究設計了十三個問題，兩位風濕病學專家對模型回應進行評分。結果顯示，雖然準確性高，但完整性差異明顯：Copilot 38.5%，GPT-3.5 55.9%，GPT-4 92.3%。特別是在「作用機制」和「生活方式」方面，GPT-4 完整性達100%。研究指出，GPT-4 有潛力改善病人對 SLE 治療的理解，但仍需進一步研究以克服臨床應用的限制。 PubMed DOI

A comparative analysis of large language models on clinical questions for autoimmune diseases.
自體免疫疾病臨床問題的大型語言模型比較分析。 Front Digit Health 2025-03-18

這項研究評估了大型語言模型（LLMs），如ChatGPT 3.5、ChatGPT 4.0和Gemini，對自體免疫疾病臨床問題的回答效果。共提出46個問題，並由專家根據五個質量維度進行評估。結果顯示，ChatGPT 4.0在所有維度上表現優於其他兩者，平均得分為199.8，顯示其在相關性、正確性、完整性、有用性和安全性方面的顯著優勢。整體而言，ChatGPT 4.0在提供準確且有用的醫療資訊上，顯示出更高的效能，顯示大型語言模型在醫療服務中的潛力。 PubMed DOI

Comparative analysis of large language models on rare disease identification.
大型語言模型在罕見疾病識別上的比較分析。 Orphanet J Rare Dis 2025-04-01

這項研究顯示大型語言模型（LLMs）在診斷罕見疾病方面的潛力，因為這些疾病因發病率低且表現多樣而難以識別。研究分析了152個來自中國醫學案例資料庫的案例，並比較了四個LLMs（ChatGPT-4o、Claude 3.5 Sonnet、Gemini Advanced和Llama 3.1 405B）與人類醫師的診斷準確性。結果顯示，LLMs的表現超越人類醫師，Claude 3.5 Sonnet的準確率達78.9%，而人類醫師僅26.3%。這顯示LLMs在臨床上可能成為有價值的工具，但在實際應用前仍需進一步驗證及考量倫理與隱私問題。 PubMed DOI

Large language models and rheumatology: are we there yet?
大型語言模型與風濕病學：我們準備好了嗎？ Rheumatol Adv Pract 2025-04-21

**重點摘要：** 最近大型語言模型（LLMs）和多模態人工智慧（AI）的進展，正在改變醫學領域，包括風濕病學。這些工具提供了新的方式來提升診斷、病患溝通以及資料管理，有機會帶來更個人化且更有效率的醫療照護。本文回顧了目前LLMs在風濕病學的應用現況，並討論未來的挑戰與機會。 PubMed DOI

RAGing ahead in rheumatology: new language model architectures to tame artificial intelligence.
在風濕病學領域邁步向前：以新型語言模型架構馴服人工智慧 Ther Adv Musculoskelet Dis 2025-04-28

AI大型語言模型正改變風濕病學，但準確度和專業知識有限。RAG技術能結合即時專業資料，提升準確性、減少幻覺，並增強可信度。雖然目前在風濕病學應用還不多，但在臨床指引查詢、病史摘要、試驗招募和衛教等方面很有潛力，也有資料隱私優勢。整體來說，RAG是更可靠且具前景的AI應用方式。 PubMed DOI

Performance of the Large Language Models in African rheumatology: a diagnostic test accuracy study of ChatGPT-4, Gemini, Copilot, and Claude artificial intelligence.
非洲風濕病學中大型語言模型的表現：ChatGPT-4、Gemini、Copilot 與 Claude 人工智慧之診斷準確性研究 BMC Rheumatol 2025-05-16

這項研究比較了四種AI語言模型在風濕病診斷上的表現，發現ChatGPT-4和Claude AI的準確率最高，超過85%，尤其在感染性疾病診斷上表現突出。不過，所有AI在腫瘤相關疾病的診斷上都比較弱。整體來說，先進AI有助於提升非洲地區風濕病診斷，但對某些疾病還有改進空間。 PubMed DOI

Large language model evaluation in autoimmune disease clinical questions comparing ChatGPT 4o, Claude 3.5 Sonnet and Gemini 1.5 pro.
自體免疫疾病臨床問題中大型語言模型的評估：比較 ChatGPT 4o、Claude 3.5 Sonnet 與 Gemini 1.5 pro Sci Rep 2025-05-21

這項研究比較三款大型語言模型與資淺、資深醫師在回答自體免疫疾病臨床問題的表現。結果發現，特別是Claude 3.5 Sonnet，在正確性和完整性等方面都勝過醫師，顯示AI有潛力協助臨床照護。 PubMed DOI

原始文章

站上相關主題文章列表