這項研究評估了兩個大型語言模型(LLMs),ChatGPT 和 Gemini,對自免疫接種後不良事件(AEFIs)因果關係的自動評估能力,特別針對 COVID-19 疫苗相關的心肌炎和心包炎。分析了美國疫苗不良事件報告系統(VAERS)中的 150 例案例。結果顯示,ChatGPT 的遵循度較高(34%),而 Gemini 僅為 7%。ChatGPT 與人類專家的中度一致性為 71%,而 Gemini 則為 53%。雖然兩者在識別 AEFIs 時都有困難,但 ChatGPT 的表現明顯優於 Gemini,更適合作為人類專業知識的輔助工具。
PubMed
DOI