這項研究評估了四個AI模型(ChatGPT 3.5、Google Bard、HuggingChat和Claude 2)生成的醫療解釋對病人理解的幫助。結果顯示,Claude 2的可讀性和可理解性最佳,但可行性較低;ChatGPT表現相似。Google Bard和HuggingChat的得分則較差。整體來看,Claude 2和ChatGPT的解釋較為清晰易懂,但研究強調仍需進一步探討這些AI解釋在實際醫療環境中的應用,並指出PEMAT評估的主觀性和AI工具的快速變化是限制因素。
PubMed
DOI