對於ChatGPT-3.5、ChatGPT-4、Gemini和Copilot在正畸透明矯正器的回應評估,發現幾個重點:
1. **準確性**:ChatGPT-4表現最佳,平均分數4.5,Copilot次之(4.35),其他模型差異不大。
2. **可靠性**:Copilot在可靠性上優於其他模型,Gemini也高於ChatGPT-3.5。
3. **品質**:Copilot提供的資訊最全面可信。
4. **可讀性**:所有模型的可讀性較低,Gemini表現較佳,FRES達54.12。
總體來看,這些模型在準確性和可靠性上表現良好,但可讀性仍需改善,以更好地服務病人。
PubMed
DOI