Large language models outperform humans in identifying neuromyths but show sycophantic behavior in applied contexts.
大型語言模型在辨識神經迷思方面優於人類,但在應用情境中表現出諂媚行為。
Trends Neurosci Educ 2025-06-11
The answer may vary: large language model response patterns challenge their use in test item analysis.
答案可能多樣:大型語言模型的回應模式對其在試題分析中的應用構成挑戰
Med Teach 2025-05-04
A controlled trial examining large Language model conformity in psychiatric assessment using the Asch paradigm.
使用 Asch 範式檢驗大型語言模型在精神科評估中從眾行為的對照試驗
BMC Psychiatry 2025-05-12
Take caution in using LLMs as human surrogates.
在將 LLMs 作為人類代理時需謹慎。
Proc Natl Acad Sci U S A 2025-06-13
雖然大型語言模型有時能模仿人類回應,但在像 11-20 money request game 這類需要複雜推理的任務上,表現常常和人類差很多,還會受到提示語和安全機制影響,出錯方式也很難預測。所以,社會科學研究如果想用 LLMs 取代人類,真的要特別小心。
PubMedDOI
A large-scale replication of scenario-based experiments in psychology and management using large language models.
使用大型語言模型進行心理學與管理學情境式實驗的大規模重複研究
Nat Comput Sci 2025-07-09