這項研究評估了三個人工智慧大型語言模型(LLMs)—ChatGPT、Google Gemini 和 MedGPT—在腎臟捐贈資訊的質量與可讀性。使用35個常見問題進行評估,結果顯示Google Gemini的CLEAR分數最高(24.33),其次是MedGPT(23.33)和ChatGPT(22)。可讀性方面,所有模型的文本都達到大學水平,ChatGPT的可讀性評分為37.32,Gemini為39.42,MedGPT為29.66。雖然資訊準確,但語言複雜度對於低教育背景者來說可能較具挑戰性,提醒醫療提供者需了解AI生成資訊的局限性。
PubMed
DOI