這項研究評估了三個大型語言模型(LLMs)——ChatGPT-3.5、ChatGPT-4 和 Gemini,針對磨牙症的資訊提供效果。研究發現:
1. **可讀性**:三個模型的可讀性相似,但 Gemini 的回應對一般讀者來說更易懂。
2. **準確性**:GPT-3.5 的準確率最高,為 68.33%,GPT-4 為 65%,Gemini 則為 55%,三者差異不大。
3. **一致性**:所有模型在不同時間的回應一致性高,GPT-3.5 最高,達 95%。
總結來說,這些模型雖然表現中等,但不應取代專業牙科建議。
PubMed
DOI