原始文章

系統性紅斑性狼瘡(SLE)是一種複雜的自體免疫疾病,對患者造成長期挑戰。這項研究探討大型語言模型(LLMs)和生成式人工智慧(genAI)在分析醫療紀錄及評估SLE標準的潛力。研究分析了78名患者的紀錄,結果顯示genAI在某些標準的評估上與臨床分類一致,但在其他標準上準確率較低,整體預測成功率為72%。這表明genAI可能成為醫療專業人員評估SLE的有用工具,但仍需改進以提升準確性。 PubMed DOI


站上相關主題文章列表

人工智慧(AI)正顯著改變風濕病學的研究,提升診斷、預後和治療預測的能力。研究者探索AI如何簡化工作流程、改善藥物發現及優化臨床試驗。機器學習在準確分類風濕性疾病和預測治療結果方面表現出色,並利用多種數據來源。生成式AI也逐漸成為自動化文獻回顧和支持臨床決策的重要工具。本文討論AI在風濕病學的應用及其面臨的倫理和監管挑戰,強調謹慎整合以發揮其潛力。 PubMed DOI

最近生成式人工智慧(AI)在皮膚科診斷的應用上有了新進展,但臨床準確性仍需進一步評估。一項研究比較了三個AI模型與專業皮膚科醫生的診斷表現,結果顯示這些AI模型的準確性與專家相當,甚至在某些罕見和複雜案例中表現更佳。不過,研究樣本量小且可能存在選擇偏差,未來需要更大且多樣化的數據集來驗證AI的臨床實用性。 PubMed DOI

生成式人工智慧(GAI)在醫療領域有顯著進展,但對於罕見疾病如原發性免疫疾病(PI)的輔助效果仍待探討。本研究評估了六種大型語言模型(LLMs)在提供PI臨床指導的表現。結果顯示,GPT-4o、Llama-3.1-70B-Instruct和Mistral-Large-Instruct-2407的診斷準確率超過88%,其中GPT-4o以96.2%領先。其他模型表現較差,準確率約60%或更低。雖然LLMs在PI診斷上顯示潛力,但仍需改進以提升臨床實用性。 PubMed DOI

這項研究評估了三種大型語言模型(LLMs)—Copilot、GPT-3.5 和 GPT-4—在提供抗瘧疾藥物對系統性紅斑狼瘡(SLE)使用的準確性和完整性。研究設計了十三個問題,兩位風濕病學專家對模型回應進行評分。結果顯示,雖然準確性高,但完整性差異明顯:Copilot 38.5%,GPT-3.5 55.9%,GPT-4 92.3%。特別是在「作用機制」和「生活方式」方面,GPT-4 完整性達100%。研究指出,GPT-4 有潛力改善病人對 SLE 治療的理解,但仍需進一步研究以克服臨床應用的限制。 PubMed DOI

這項研究評估了大型語言模型(LLMs),如ChatGPT 3.5、ChatGPT 4.0和Gemini,對自體免疫疾病臨床問題的回答效果。共提出46個問題,並由專家根據五個質量維度進行評估。結果顯示,ChatGPT 4.0在所有維度上表現優於其他兩者,平均得分為199.8,顯示其在相關性、正確性、完整性、有用性和安全性方面的顯著優勢。整體而言,ChatGPT 4.0在提供準確且有用的醫療資訊上,顯示出更高的效能,顯示大型語言模型在醫療服務中的潛力。 PubMed DOI

這項研究顯示大型語言模型(LLMs)在診斷罕見疾病方面的潛力,因為這些疾病因發病率低且表現多樣而難以識別。研究分析了152個來自中國醫學案例資料庫的案例,並比較了四個LLMs(ChatGPT-4o、Claude 3.5 Sonnet、Gemini Advanced和Llama 3.1 405B)與人類醫師的診斷準確性。結果顯示,LLMs的表現超越人類醫師,Claude 3.5 Sonnet的準確率達78.9%,而人類醫師僅26.3%。這顯示LLMs在臨床上可能成為有價值的工具,但在實際應用前仍需進一步驗證及考量倫理與隱私問題。 PubMed DOI

**重點摘要:** 最近大型語言模型(LLMs)和多模態人工智慧(AI)的進展,正在改變醫學領域,包括風濕病學。這些工具提供了新的方式來提升診斷、病患溝通以及資料管理,有機會帶來更個人化且更有效率的醫療照護。本文回顧了目前LLMs在風濕病學的應用現況,並討論未來的挑戰與機會。 PubMed DOI

AI大型語言模型正改變風濕病學,但準確度和專業知識有限。RAG技術能結合即時專業資料,提升準確性、減少幻覺,並增強可信度。雖然目前在風濕病學應用還不多,但在臨床指引查詢、病史摘要、試驗招募和衛教等方面很有潛力,也有資料隱私優勢。整體來說,RAG是更可靠且具前景的AI應用方式。 PubMed DOI

這項研究比較了四種AI語言模型在風濕病診斷上的表現,發現ChatGPT-4和Claude AI的準確率最高,超過85%,尤其在感染性疾病診斷上表現突出。不過,所有AI在腫瘤相關疾病的診斷上都比較弱。整體來說,先進AI有助於提升非洲地區風濕病診斷,但對某些疾病還有改進空間。 PubMed DOI

這項研究比較三款大型語言模型與資淺、資深醫師在回答自體免疫疾病臨床問題的表現。結果發現,特別是Claude 3.5 Sonnet,在正確性和完整性等方面都勝過醫師,顯示AI有潛力協助臨床照護。 PubMed DOI