原始文章

肥大細胞活化症候群(MCAS)的診斷越來越普遍,雖然有一套廣泛接受的聯盟標準,但也出現了其他替代標準。本研究評估這些替代標準的診斷特異性和一致性,結果顯示替代標準的診斷變異性較大且精確度較低,可能導致不相關的診斷。研究指出,這引發了對MCAS過度診斷的擔憂,並可能忽略更合適的診斷。 PubMed DOI


站上相關主題文章列表

GPT-4被用於病例報告的診斷挑戰,但僅在少數病例中表現良好。為了保護隱私,測試了提取術語生成提示的方法。結果顯示從結構化數據創建的提示效果更差,不同版本的GPT-4表現也不同。這凸顯了在臨床診斷中使用GPT-4的限制,強調了需要研究如何從臨床數據中創建有效提示。 PubMed DOI

大型語言模型(LLMs)在自然語言處理中廣泛運用,包括在醫學領域進行臨床推理。一項研究比較了不同LLMs在辨識自體炎症性疾病的準確性,結果顯示,GPT-4在某些疾病的辨識上與醫師相當,但在其他方面醫師表現較好。這研究顯示LLMs在診斷自體免疫性疾病上有潛力。 PubMed DOI

研究使用大型語言模型評估骨骼放射性核素掃描報告對SAPHO綜合症的診斷效果,並探討模型如何提升診斷。透過ChatGPT-4.0分析151位懷疑患有SAPHO綜合症的患者資料,結果顯示該模型在結合皮膚症狀後,具有83.5%的敏感度、69.4%的特異度和76.8%的總體準確性。研究指出,大型語言模型可有效協助診斷複雜疾病如SAPHO綜合症。 PubMed DOI

研究比較了四個大型語言模型在心血管和胸部影像診斷上的效果,包括ChatGPT3.5、Google Bard、Microsoft Bing和Perplexity。結果顯示Perplexity在診斷準確度和一致性上表現最佳。在選擇臨床或教育用模型時,需考慮這些差異。 PubMed DOI

纖維肌痛是個復雜的疾病,主要症狀是全身疼痛和情緒困擾,診斷很有挑戰性。患者常有認知和情緒變化,對疼痛相關資訊更敏感。研究指出,利用大型語言模型進行情感分析可幫助辨識疼痛表達中微妙的差異,尤其對於纖維肌痛的診斷有幫助。這項研究顯示,透過快速工程方法針對纖維肌痛的語言細微差異,能更準確地區分患者。未來還需進一步研究,包括與其他患者群體的驗證。 PubMed DOI

研究比較了大型語言模型(LLMs)在臨床案例診斷上的表現,發現GPT4比GPT3.5更準確且提供更專業的診斷列表。然而,兩者仍有可能漏掉最可能的診斷。研究建議LLMs像GPT4可擴展診斷考慮範圍,但需改進以更符合疾病發生率和文獻。 PubMed DOI

大型語言模型(LLMs)在臨床診斷支持上展現了潛力。本研究比較了Bing、ChatGPT和Gemini三個LLMs在處理複雜臨床案例的表現,並評估了一個新開發的評分標準。結果顯示,Gemini的表現最佳,且評分工具的可靠性高,觀察者間變異性低。研究強調不同情境下模型表現的差異,並指出在實施前需評估診斷模型的有效性,為AI在臨床應用的整合提供了新的討論基礎。 PubMed DOI

這項研究旨在識別和視覺化難治性肌肉骨骼疼痛綜合症的病人群體,特別是纖維肌痛症。研究涵蓋202名患者,發現78%符合纖維肌痛症標準,且許多人有精神或風濕性疾病。透過層次聚類分析,識別出五種不同的患者表型,主要區別在於獨居、體重指數、疼痛類型等。研究還開發預測模型,顯示某些藥物和獨居對疼痛減輕有負面影響,強調了解這些亞型可促進個性化治療,並為未來臨床試驗提供參考。 PubMed DOI

這項研究探討大型語言模型(LLMs)在識別接受免疫檢查點抑制劑(ICI)治療患者的免疫相關不良事件(irAEs)中的應用,並與傳統手動裁定及ICD代碼進行比較。研究分析了超過12年的住院紀錄,發現LLMs在檢測irAEs的敏感性顯著高於ICD代碼,且效率更佳,平均每份病歷僅需9.53秒。總體來說,LLMs被認為是檢測irAEs的有效工具,提供更高的敏感性和效率。 PubMed DOI

這項研究評估了10個大型語言模型(LLMs)與2位認證放射科醫生在分析胸部放射學案例的診斷表現。研究收集了124個案例,結果顯示Claude 3 Opus的診斷準確率最高,達70.29%,而放射科醫生的準確率則較低,分別為52.4%和41.1%。LLMs在特定案例中的表現較佳,顯示在適當醫療監督下,LLMs可能成為臨床決策的重要工具。 PubMed DOI