這篇論文探討大型語言模型(LLMs)如GPT-3.5、GPT-4和LLaMa-2在博弈理論中的策略行為,並分析遊戲結構與背景對決策的影響。研究發現:
- **GPT-3.5** 對背景敏感,但抽象策略思考較弱。
- **GPT-4** 專注於遊戲內部機制,對背景敏感度低,區分遊戲類型較粗略。
- **LLaMa-2** 在理解遊戲結構與考量背景上取得平衡,處理複雜策略情境時更具優勢。
總體來看,LLaMa-2在整合遊戲結構與背景方面表現最佳,而GPT-4則偏向一般化的結構策略。
PubMed
DOI